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宕 
了 路 


大 家 还 记得 目 己 初次 接触 计算 机 时 的 情形 吗 ? 想必 多 数 谈 者 使 用 
的 都 是 Windows 系统 ， 应 该 也 有 不 少 读者 使 用 Visual Studio 和 Java 等 
集成 开发 环境 ( IDE，Integrated Development Environment， 即 集成 了 编 
程 所 需 的 各 种 工具 的 开发 软件 ) 开发 过 程序 。Windows 的 图 形 化 操作 界 
面 ， 大 大 提高 了 计算 机 操作 的 便利 性 ， 而 利用 集成 开发 环境 开发 程序 ， 
怠 像 用 绘图 软件 画图 一 样 简单 。 由 此 可 见 ， 这 是 一 个 便利 的 时 代 。 


然而 ， 现 实 却 不 容 乐 观 ， 我 们 在 至 受 这 些 方便 的 同时 也 付出 了 代 
价 。 虽 然 拥 有 一 定 的 编程 能 力 ， 却 无 法 进一步 提高 日 身 技 能 ; 知识 应 用 
能 力 的 不 足 导 致 无 法 编写 源 程序 。 越 来 越 多 的 程序 员 正 为 这 些 问题 而 
烦恼 。 个 中 原因 在 于 ， 大 家 不 了 解 程序 运行 的 根本 机 制 。 


“双击 程序 图 标 ， 程 序 开始 运 行 "， 作 为 一 名 程序 员 ， 对 程序 的 了 
解 仅仅 停留 在 这 一 表层 是 不 行 的 。 我 们 还 应 该 了 解 更 深层 的 机 制 加 载 
到 内 存 中 的 机 器 语言 程序 ， 由 CPU 进行 解析 和 运行 ， 进 而 计算 机 系统 
整体 的 控制 和 数据 运算 也 开始 运行 。 了 解 了 程序 的 运行 机 制 后 ， 就 能 
找到 编写 源 程序 的 方法 。 


本 书 以 通俗 易 懂 的 方式 来 解析 程序 的 运行 机 制 ， 适 合 想 要 学 习 编 
程 的 读者 ， 迫 切 和 希望 提升 技能 的 初级 程序 员 ， 以 及 对 计算 机 较为 熟悉 
的 中 级 用 户 阅 读 。 为 了 便于 说 明 ， 书 中 涉及 了 不 少 计 算 机 硬件 知识 ， 
不 过 本 书 的 主题 依然 是 编程 ， 也 就 是 软件 。 

《日 经 Software》 杂志 上 连载 过 名 为 “程序 是 怎样 跑 起 来 的 ”的 文 
章 ， 而 本 书 就 是 在 整合 以 上 内 容 的 基础 上 创作 的 。2001 年 10 月 ， 本 书 
第 1 版 出 版 后 ， 受 到 了 众多 读者 的 欢迎 ， 我 们 也 收 到 了 很 多 反馈 信息 。 
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大 部 分 读者 表示 “了 解 了 CPU 的 寄存 器 和 内 存 的 运行 方式 ， 也 知道 了 
自己 编写 的 程序 的 运行 机 制 >， 收 获 颇 丰 。 不 过 也 有 编程 经 验 较 少 的 读 
者 表示 “内 容 有 点 难 ”。 


值 此 第 2 版 出 版 之 际 ， 我 再 次 核对 了 全 文 ， 大 幅 增 加 了 寄存 器 和 
栈 等 内 容 的 相关 说 明 ， 并 作 了 详细 的 注释 。 实 例 程 序 的 代码 也 由 原来 
的 Visual BASIC 语言 ， 换 成 了 更 便于 说 明 程 序 运行 机 制 的 C 语言 ， 并 
在 书 的 末尾 添加 了 一 个 辅助 章节 ， 对 C 语言 进行 了 简单 的 介绍 。 通 过 
这 样 的 改动 ， 相 信和 即便 是 觉得 第 1 版 有 点 难 的 读者 ， 也 会 感到 满意 。 


无 论 任何 事情 ， 了 解 其 本 质 非 浓重 要。 只 有 了 解 了 本 质 才能 提高 
利用 效率 。 这 样 一 来 ， 即 使 有 新 技术 出 现 ， 也 能 很 容易 地 理解 并 和 苔 握 。 
接 下 来 ， 就 让 我 们 一 起 在 本 书 中 探索 程序 的 奥秘 ,寻求 程序 的 本 质 吧 。 


和 天 汰 入 雄 
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逻辑 移 位 、 符 号 扩展 


计算 机 进行 小 数 运算 时 出 错 的 原因 
二 进 制 形式 的 小 数 、 双 精度 浮 点 数 、 单 精 
EKER 
16 进 制 数 


熟练 使 用 有 校 有 角 的 内 存 


内 存 IC、 内 存 容量 、 数 据 类 型 、 指 针 、 
数组 、 栈 、 队 列 、 环 形 缓冲 区 、 链 表 、 
二 叉 搜 索 树 


“六 内 存 和 磁盘 的 亲密 关系 


存储 程序 方式 、 磁 盘 缓存 、DLL 
文件 stdcall 几 启 区 、 策 


“97 对 亲自 尝试 压缩 数据 


文件 、RLE 算法 、 莫 尔 斯 编码 、 哈 
夫 曼 人 算 友 可 这 奈 御 、 括 可 这 永 入 、 
BMP、 JPEG、 TIFF 
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程序 是 在 何 种 环境 中 运行 的 
操作 系统 .硬件 .Windows、MS-DOS、 


OUND va ROBIOs 
引导 


:7 六 从 源 文件 到 可 执行 文件 


源 代码 、 本 地 代码 、 编 译 、 链 接 、 启 动 、 库 文件 、 栈 、 堆 、 
静态 链接 、 动 态 链接 


操作 系统 和 应 用 的 关系 


监控 程序 、 系 统 调用 、 移 植 性 、API、 
多 任务 、 设 备 驱 动 


-LI 通过 汇编 语言 了 解 程序 的 实际 构成 
助 记 符 、 汇编 、 伪 指令 、 段 定义 、 


push、pop、 调 用 函数 、 全 局 变量 、 
局 部 变量 、 循 环 、 条 件 分 支 


”| 广 生 硬件 控制 方法 


INMOUT 指令 、VQO 痛 口 号 、 中 断 处 理 、 
实时 处 理 、IRO、DMA、VRAM 


第 12 章 让 计算 机 “思考 ” 
随机 数 、 伪 随机 数 、 随 机 数 种 子 、 计 


FM 


智能 (Al ) 
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本 书 共 12 草 ， 每 章 由 “ 热 号 问答”“ 本 章 重 点 ”“ 正 文 ” 三 部 分 构成 。 对 
专业 术语 的 解说 ， 放 在 了 正文 的 脚注 部 分 。 有 些 革 市 还 设置 了 “专栏 ”"。 男 
外 ， 本 书 的 附录 部 分 对 C 语 言 进行 了 介绍 ， 刚 开始 学 习 编程 的 朋友 ， 请 一 定 
阅读 一 下 。 


@ 执 身 问答 


在 每 草 的 开头 罗列 了 一 些 傈 单 的 问答 ， 大 家 不 妨 在 阅读 时 挑 成 一 下 。 这 样 
整 可 以 市 着 问题 来 阅读 正文 了 。 


@ 本章 重点 


这 部 分 是 对 正文 内 容 的 高 度 总 结 。 通 过 阅读 这 部 分 ， 可 以 确定 本 章 市 和 是否 


有 目 己 关心 的 内 容 。 


@ 正 文 


在 这 部 分 中 ， 笔 者 以 简明 易 懂 的 方式 ， 从 各 曹 市 的 主题 出 发 ， 对 程序 的 运 
行 机 制 进行 说 明 。 虽 然 有 时 会 出 现 C 语言 程序 ， 但 其 中 做 了 大 量 的 注释 ， 即 使 
对 编程 请 言 不 熟悉 的 朋友 也 能 正常 阅读 。 


和 @ 专 栏 “ 如 果 是 你 ， 你 会 怎样 介绍 ?” 

在 这 部 分 中 ， 笔 者 为 大 家 展示 了 他 癌 那 些 不 熟悉 程序 的 朋友 介绍 程序 运行 
机 制 的 过 程 。 通 过 向 他 人 介绍 ， 可 以 对 自己 的 和 掌握 程度 进行 充分 的 验证 。 各 位 
读者 在 阅读 时 也 不 妨 考虑 一 下 : 如 果 是 你 ， 你 会 怎样 介绍 呢 ? 


* 本 书 在 写作 过 程 中 ， 尽 量 避 免 内 容 局 限 在 特定 的 人 硬件 和 软件 上 。 但 在 一 些 具体 的 示例 中 ， 涉 及 电脑 ( 特 
别 是 AT 兼容 机 )、Windows(32 位 ) 以 及 Borland C++ 等 。 

另外 ， 本 书 中 所 涉及 的 Windows、Borland C++ 等 软件 ， 都 是 以 笔者 写作 当时 的 最 新 版 为 准 进行 描述 的 ， 
之 后 的 软件 版 本 可 能 会 有 所 变化 ， 这 一 点 请 注意 。 
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4 到 4 


,A 了 工 A 至 
二 | 


2 -和 
对 枉 逊 只 末 沉 CPU 
| /A 


S13 
| 热 | 身 | 问答 上 
热 


阅读 正文 前 ， 让 我 们 先 回答 下 面 的 问题 来 热 热身 吧 。 

1. 程序 是 什么 ? 

2. 程序 是 由 什么 组 成 的 ? 

3. 什么 是 机 器 语言 ? 

4. 正在 运行 的 程序 存储 在 什么 位 置 ? 

5. 什么 是 内 存 地 址 ? 

6. 计算 机 的 构成 元 件 中 ， 负 责 程 序 的 解释 和 运行 的 是 哪个 ? 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


. 指示 计算 机 每 一 步 动作 的 一 组 指令 
. 指令 和 数据 
. CPU 可 以 直接 识别 并 使 用 的 语言 


内 存 


. 内 存 中 ， 用 来 表示 命令 和 数据 存储 位 置 的 数值 


CPU 


,一般 所 说 的 程序 ， 壁 如 运动 会 、 音 乐 会 的 程序 等 ， 指 的 是 “ 行 


事 的 先后 次 序 ”。 计 算 机 程序 也 是 一 样 的 道理 。 


. 程序 是 指令 和 数据 的 组 合体 。 例 如 ，C 语言 “printf ("你 好 ");” 


这 个 简单 的 程序 中 ，printf 是 指令 ，" 你 好 " 是 数据 。 


. CPU 能 够 直接 识别 和 执行 的 上 只 有 机 楷 语 言 。 使 用 C、Java 等 话 


言 编写 的 程序 ， 最 后 都 会 转化 成 机 器 语言 。 


.硬盘 和 磁盘 等 妹 介 上 保存 的 程序 被 复制 到 内 存 后 才能 运行 。 
， 内存 中 保存 命令 和 数据 的 场所 ， 通 过 地 址 来 标记 和 指定 。 地 址 


由 整数 值 表示 。 


. 计算 机 的 构成 元 件 中 ， 根 据 程序 的 指令 来 进行 数据 运算 ， 并 控 


制 整个 计算 机 的 设备 称 作 CPU。 大 家 熟知 的 奔腾 ( Pentium ) 就 
是 CPU 的 一 种 。 
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首先 让 我 们 来 看 一 下 解释 和 运行 程序 的 CPU。 
CPU 是 英文 Central Processing Unit ( 中 央 处 理 器 ) 的 
缩写 ， 相 当 于 计算 机 的 大 脑 ， 它 的 内 部 由 数 百 万 至 数 亿 个 晶体 管 构成 ， 


KE 
是 没有 任何 帮助 的 。 程 序 员 还 需要 理解 CPU 是 如 何 运行 的 ， 特 别 
弄 清楚 负责 保存 指令 和 数据 的 寄存 器 的 机 制 。 了 解 了 寄存 器 ， 也 
就 自然 而 然 地 理解 了 程序 的 运行 机 制 。 可 能 有 很 多 读者 会 认为 CPU 的 
运行 机 制 比较 难 ， 其 实 它 非常 简单 。 所 以 ， 不 妨 放 松 心情 ， 跟 随笔 者 
一 起 往 下 阅读 吧 。 


团 1.1 CPU 的 内 部 结构 解析 

图 1-1 展示 了 程序 运行 的 一 般 流程 。 可 以 说 了 解 程序 的 运行 流程 是 
掌握 程序 运行 机 制 的 基础 和 前 提 。 详 细 内 容 会 在 接 下 来 的 章节 中 逐渐 
展开 ， 这 里 主要 是 希望 大 家 先 有 个 大 致 印 象 。 在 这 一 流程 中 ，CPU 所 
负责 的 就 是 解释 和 运行 最 终 转换 成 机 器 语言 的 程序 内 容 。 


CPU 和 内 存 是 由 许多 晶体 管 组 成 的 电子 部 件 ， 通 常 称 为 IC 
( Integrated Circuit， 集 成 电路 )。 从 功能 方面 来 看 ， 如 网 1-2 所 示 ，CPU 
的 内 部 由 寄存 器 、 控 制 锋 、 运 算 器 和 时 钟 四 个 部 分 构成 ， 各 部 分 之 间 
由 电流 信号 相互 连通 。 寄 存 器 可 用 来 暂 存 指令 、 数 据 等 处 理 对 象 ， 可 


(DD CPU 是 用 来 表示 计算 机 内 部 元 件 功能 的 术语 。 另 一 方面 ， 奔 腾 等 半导体 芯 
片 ， 通 常 称 为 微 处 理 器 。 不 过 ， 由 于 大 部 分 计算 机 通常 只 有 一 个 微 处 理 器 
来 承担 CPU 的 功能 ， 所 以 本 章 不 对 此 进行 区 分 ,统一 使 用 CPU 这 一 称呼 。 
CPU 由 具有 ON/OFF 开关 功能 的 面体 管 构 成 。 另 外 ， 有 的 CPU 在 一 个 集 
成 电路 中 集成 了 两 个 CPU 芯片 ， 我 们 称 之 为 双核 ( dual core ) CPU。 
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以 将 其 看 作 是 内 存 的 一 种 。 根 据 种 类 的 不 同 ， 一 个 CPU 内 部 会 有 
20 一 100 个 寄存 需 。 控 制 器 负责 把 内 存 上 的 指令 、 数 据 等 读 入 寄存 需 ， 
并 根据 指令 的 执行 结果 来 控制 整个 计算 机 。 运 算 器 负责 运算 从 内 存 读 
入 寄存 器 的 数据 。 时 钟 负责 发 出 CPU 开始 计时 的 时 钟 信号 “。 不 过 , 也 
有 些 计算 机 的 时 钟 位 于 CPU 的 外 部 。 


程序 员 用 C 语 言 等 高 级 语言 编写 程序 


(3 程序 运行 时 ， 在 内 存 中 生成 EXE 文 件 的 副本 


(4)CPU 解 释 并 执行 程序 内 容 


(DD 时钟 信号 英文 叫 作 clock puzzle。Pentium 2 GHz 表示 时 钟 信号 的 频率 为 
2GHz (1 GHz = 10 亿 次 / 秒 )。 也 就 是 说 ， 时 钟 信 号 的 频率 越 高 ，CPU 的 
运行 速度 越 快 。 
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接 下 来 简单 地 解释 一 下 内 存 。 通 常 所 说 的 内 存 指 的 是 计算 机 的 主 
存储 器 ( main memory ) ,简称 主 存 。 主 存 通过 控制 芯片 等 与 CPU 相连 ， 
主要 负责 存储 指令 和 数据 。 主 存 由 可 读 写 的 元 素 构成 ， 每 个 字 节 (1 字 
节 = 8 位 ) 都 带 有 一 个 地 址 编号 。CPU 可 以 通过 该 地 址 读 取 主 存 中 的 
§ 令 和 数据 ， 当 然 也 可 以 写 入 数据 。 但 有 一 点 需要 注意 ， 主 存 中 存储 
的 指令 和 数据 会 随 着 计算 机 的 关机 而 自动 清除 。 


了 解 了 CPU 的 构造 后 ， 大 家 对 程序 的 运行 机 制 的 理解 是 不 是 也 加 
深 了 一 些 ? 程序 局 动 后 ， 根 据 时 钟 信号 ， 控 制 价 会 从 内 存 中 读 取 指令 
和 数据 。 通 过 对 这 些 指令 加 以 解释 和 运行 ,运算 带 就 会 对 数据 进行 运 


JJ 主 存 位 于 计算 机 机 体内 部 ， 是 负责 存储 程序 、 数 据 等 的 装置 。 主 存 通常 使 
用 DRAM (Dynamic Random Access Memory， 动 态 随 机 存 取 存储 器 ) 芯片 。 
DRAM 可 以 对 任何 地 址 进行 数据 的 读 写 操作 ， 但 需要 保持 稳定 的 电源 供给 
并 时 常 刷新 ( 确保 是 最 新 数据 )， 关 机 后 内 容 将 自动 清除 。 关 于 内 存 IC， 第 
4 章 有 详细 介绍 。 
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算 ， 控 制 带 根据 该 运算 结 末 来 控制 计算 机 。 看 到 “控制 ”一 词 时 ， 大 家 
可 能 会 将 事情 想象 得 过 于 复杂 ， 其 实 所谓 的 控制 就 是 指数 据 运 算 以 外 


的 处 理 (主要 是 数据 输入 输出 的 时 机 控制 ) 比如 内 存 和 磁盘 等 妹 介 的 
输入 输出 、 键 盘 和 鼠标 的 输入 、 显 示 硕 和 打印 机 的 输出 等 ， 这 些 都 是 
控制 的 内 容 。 


加 1.2 ”CPU 是 寄存 器 的 集合 体 

CPU 的 四 个 构成 部 分 中 ， 程 序 员 只 需要 了 解 寄 存 器 即 可 ， 其 余 三 
个 都 不 用 太 过 关注 。 那 么 ， 为 什么 必须 要 了 解 寄存 器 呢 ? 这 是 因为 程 
序 是 把 寄存 器 作为 对 象 来 描述 的 。 


首先 我 们 来 看 一 下 代码 清单 1-1。 这 是 用 汇编 语言 ( assembly ) 纺 
写 的 程序 的 一 部 分 。 汇 编 语 言 采 用 助 记 符 ( memonic ) 来 编写 程序 ， 
一 个 原本 是 电气 信号 的 机 器 语言 ”指令 都 会 有 一 个 与 其 相应 的 助 记 符 ， 
助 记 符 通 常 为 指令 功能 的 英语 单词 的 简写 。 例 如 ，mov 和 add 分 别 是 
数据 的 存储 (move ) 和 相 加 ( addition ) 的 简写 。 汇 编 语言 和 机 器 语言 
基本 上 是 一 一 对 应 的 。 这 一 点 和 C 语言 、Java 语言 等 高 级 编程 语言 ”有 
很 大 不 同 ， 这 也 是 我 们 使 用 汇编 语言 来 说 明 CPU 运行 的 原因 。 通 常 我 
们 将 汇编 语言 编写 的 程序 转化 成 机 器 语言 的 过 程 称 为 汇编 ; 反之 ， 机 器 


〇 把 汇编 语言 转化 成 机 器 语言 的 程序 称 为 汇编 器 (assembler )。 有 时 汇编 语言 
也 称 为 汇编 。 详 情 可 参阅 第 10 齐 。 

@) 机 器 语言 是 指 CPU 能 直接 解释 和 执行 的 语言 。 

(3) 高 级 编程 语言 是 指 能 够 使 用 类 似 于 人 类 语言 ( 主要 是 英语 ) 的 语法 来 记述 
的 编程 语言 的 总 称 。BASIC、C、C++、Java、Pascal、FORTRAN、COBOL 
等 语言 都 是 高 级 编程 语言 。 使 用 高 级 编程 语言 编写 的 程序 ， 经 过 编译 转换 
成 机 器 语言 后 才能 运行 。 与 高 级 编程 语言 相对 ， 机 器 语言 和 汇编 语言 称 为 
低级 编程 语言 。 
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语言 程序 转化 成 汇编 语言 程序 的 过 程 则 称 为 反 汇 纺 


代码 清单 1-1 汇编 语言 编写 的 程序 示例 
mov eax。 dword tr [ebp 8] … 把 数值 从 内 存 复 制 到 eax 


add eax，dword ptr [ebp-0Ch] …exa 的 数值 和 内 存 的 数值 相 加 
mov dword ptr [ebp-4] ，eax  … 把 exa 的 数值 ( 上 一 步 的 相 加 结果 ) 存储 在 内 存 中 


通过 阅读 汇编 语言 编写 的 代码 ， 能 够 了 解 转 化 成 机 融 语 言 的 程序 
的 运行 情况 。 从 代码 清单 1-1 的 汇编 语言 程序 示例 中 也 可 以 看 出 ， 机 天 
语言 级 别 的 程序 是 通过 寄存 带 来 处 理 的 。 也 就 是 说 ， 在 程序 员 看 来 
“CPU 是 寄存 人 此 的 集合 体 "。 至 于 控制 带 、 运 算 各 和 时 钟 ， 程 序 员 内需 
要 知道 CPU 中 还 有 这 儿 避 分 就 足够 耻 。 


代码 清单 1-1 中 ，eax 和 ebp 表示 的 都 是 寄存 器 。 通 过 阅读 刚才 的 
示例 代码 ， 想 必 大 家 对 程序 使 用 寄存 器 来 实现 数据 的 存储 和 加 法 运算 
这 一 情况 应 该 有 所 了 解 了 。 汇 编 语言 是 80386 以 上 的 CPU 所 使 用 的 语 
言 。eax 和 ebp 是 CPU 内 部 的 寄存 器 的 名 称 。 内 存 的 存储 场所 通过 地 
址 编号 来 区 分 ， 而 寄存 器 的 种 类 则 通过 名 字 来 区 分 。 


上 上 文 可 能 有 些 难以 理解 ， 不 过 不 用 担心 ， 因 为 我 们 并 不 要 求 大 家 
必须 掌握 CPU 的 所 有 寄存 器 种 类 和 汇编 语言 ， 大 家 只 需 对 CPU 是 怎么 
处 理 程序 的 有 一 个 大 致 印 象 即 可 。 也 就 是 说 ， 使 用 高 级 语言 编写 的 程 
序 会 在 编译 “后 转化 成 机 器 语言 ， 然 后 再 通过 CPU 内 部 的 寄存 器 来 处 
理 。 例 如 ，a=1+2 这 样 的 高 级 语言 的 代码 程序 在 转化 成 机 器 语言 后 ， 
就 是 利用 寄存 器 来 进行 相 加 运算 和 存储 处 理 的 。 


〇 80386 是 美国 英特尔 公司 开发 的 微 处 理 器 的 产品 名 。 “80386 以 上 ”是 指 
80386、80486、 和 奔腾 等 微 处 理 器 。 

@) 编译 是 指 将 使 用 高 级 编程 语言 编写 的 程序 转换 为 机 器 语言 的 过 程 ， 其 中 ， 
用 于 转换 的 程序 被 称 为 编译 器 ( compiler )。 
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不 同类 型 的 CPU， 其 内 部 寄存 器 的 数量 、 种 类 以 及 寄存 器 存储 的 
数值 范围 都 是 不 同 的 。 不 过 ， 根 据 功 能 的 不 同 ， 我 们 可 以 将 寄存 器 大 
致 划分 为 八 类 ， 如 表 1-1 所 示 。 可 以 看 出 ， 寄 存 器 中 存储 的 内 容 既 可 以 
是 指令 也 可 以 是 数据 。 其 中 ， 数 据 分 为 “用 于 运算 的 数值 ”和 “表示 内 
存 地 址 的 数值 ”两 种 。 数 据 种 类 不 同 ， 存 储 该 数值 的 寄存 器 也 不 同 。 
CPU 中 每 个 寄存 器 的 功能 都 是 不 同 的 。 用 于 运算 的 数值 放 在 累加 寄存 
需 中 存储 ， 表 示 内 存 地 址 的 数值 则 放 在 基 址 寄存 器 和 变 址 寄存 器 中 


存储 。 代 码 清单 1-1 的 程序 中 用 到 的 eax 和 ebp 分 别 是 累加 寄存 器 
和 基 址 寄存 屁 。 


表 1-1 寄存 器 的 主要 种 类 和 功能 


种 类 功 能 
累加 寄存 器 ( accumulator register ) 存储 执行 运算 的 数据 和 运算 后 的 数据 
aoler) 存储 运算 处 理 后 的 CPU 的 状态 
程序 计数 器 ( program counter ) 存储 下 一 条 指令 所 在 内 存 的 地 址 
基 址 寄存 器 ( base register ) 存储 数据 内 存 的 起 始 地 址 
变 址 寄存 器 ( index register ) 存储 基 址 寄存 器 的 相对 地 址 


通用 寄存 器 ( general purpose register ) ” 存储 任意 数据 
存储 指令 。CPU 内 部 使 用 ， 程 序 员 无 法 通 


日 令 寄存 器 (instruction register ) 过 程序 对 该 寄存 器 进行 读 写 操作 
栈 寄 存 器 ( stack register ) 存储 栈 区 域 的 起 始 地 址 


对 程序 员 来 说 ，CPU 是 什么 呢 ?” 如 图 1-3 所 示 ，CPU 是 具有 各 种 
功能 的 寄存 需 的 集合 体 。 其 中 ， 程 序 计 数 禹 、 累 加 寄存 器 、 标 志 寄 存 
稻 、 指 令 寄存 器 和 栈 寄 存 器 都 具有 一 个 ， 其 他 的 寄存 器 一 般 有 多 个 。 
程序 计数 器 和 标志 寄存 器 比较 特殊 ， 这 一 点 在 后 面 的 章节 中 会 详细 说 
明 。 另 外 ， 存 储 指 令 的 指令 寄存 融 等 寄存 大 ， 由 于 不 需要 程序 员 做 多 
关注 ， 因 此 图 1-3 中 没有 提 到 。 
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变 址 寄存 器 通用 寄存 器 
基 址 寄存 器 、 变 址 寄存 器 、 通 用 寄存 器 都 不 止 一 个 


图 1-3 程序 员 眼 中 的 CPU ( CPU 是 寄存 器 的 集合 体 ) 


哮 1.3 决定 程序 流程 的 程序 计数 器 

只 有 1 行 的 有 用 程序 是 很 少见 的 ， 机 器 语言 的 程序 也 是 如 此 。 在 
对 CPU 有 了 一 个 大 体 印 象 后 ， 接 下 来 我 们 看 一 下 程序 是 如 何 按照 流程 
来 运行 的 。 

图 1-4 是 程序 起 动 时 内 存 内 容 的 模型 。 用 户 发 出 启动 程序 的 指示 
后 ，Windows 等 操作 系统 ”会 把 硬盘 中 保存 的 程序 复制 到 内 存 中 。 示 例 
中 的 程序 实现 的 是 将 123 和 456 两 个 数值 相 加 ， 并 将 结果 输出 到 显示 
器 上 。 正 如 前 文 所 介绍 的 那样 ， 存 储 指令 和 数据 的 内 存 ， 是 通过 地 址 
来 划分 的 。 由 于 使 用 机 器 语言 难以 清晰 地 表明 各 地 址 存储 的 内 容 ， 因 
此 这 里 我 们 对 各 地 址 的 存储 内 容 添加 了 注释 。 实 际 上 ， 一 个 命令 和 数 
据 通 常 被 存储 在 多 个 地 址 上 ， 但 为 了 便于 说 明 ， 图 1-4 中 把 指令 、 数 据 
分 配 到 了 一 个 地 址 中 。 


地 址 0100 是 程序 运行 的 开始 位 置 。Windows 等 操作 系统 把 程序 从 
硬盘 复制 到 内 存 后 ， 会 将 程序 计数 需 ( CPU 寄存 融 的 一 种 ) 设 定 为 


QD 操作 系统 ( operating system ) 是 指 管理 和 控制 计算 机 硬件 与 软件 资源 的 计算 
机 程序 。 关 于 操作 系统 的 功能 ， 第 9 章 有 详细 说 明 。 
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0100， 然 后 程序 便 开 始 运行 。CPU 每 执行 一 个 指令 ， 程 序 计数 器 的 值 
就 会 自动 加 1。 例 如 ，CPU 执行 0100 地 址 的 指令 后 ， 程 序 计数 器 的 值 
就 变 成 了 0101 ( 当 执 行 的 指令 占据 多 个 内 存 地 址 时 ， 增 加 与 指令 长 度 
相应 的 数值 ) 然后 ，CPU 的 控制 器 就 会 参照 程序 计数 器 的 数值 ， 从 内 
存 中 读 取 命令 并 执行 。 也 就 是 说 ， 程 序 计 数 器 决定 着 程序 的 流程 。 


程序 计数 器 
数值 的 变化 地 址 内 存 中 的 内 容 
0100 0100 
OO OO 
O102 | 攻 0 有 
ONOS 程 0103 
0104 0104 
OOS 
0106 


1-4 内存 中 配置 的 程序 示例 ( 显示 相 加 的 结果 ) 


轩 1.4 条 件 分 支 和 循环 机 制 

程序 的 流程 分 为 顺序 执行 、 条 件 分 支 和 循环 三 种 。 顺 序 执行 是 指 
按照 地 址 内 容 的 顺序 执行 指令 。 条 件 分 支 是 指 根 据 条 件 执行 任意 地 址 
的 指令 。 循 环 是 指 重 复 执行 同一 地 址 的 指令 。 顺 序 执行 的 情况 比较 简 
单 ， 每 执行 一 个 指令 程序 计数 剖 的 值 就 目 动 加 1。 但 厂 程 序 中 存在 条 件 
分 支 和 循环 ， 机 器 语言 的 指令 就 可 以 将 程序 计数 器 的 值 设 定 为 任意 地 
址 (不 是 +1 )。 这 样 一 来 ， 程 序 便 可 以 返回 到 上 一 个 地 址 来 重复 执行 同 
一 个 指令 ， 或 者 跳 转 到 任意 地 址 。 接 下 来 ， 我 们 就 以 条 件 分 文 为 例 ， 
来 具体 说 明 循 环 时 程序 计数 硕 的 数值 设 定 机 制 也 是 一 样 的 。 
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图 1-5 表示 把 内 存 中 存储 的 数值 (示例 中 是 123 ) 的 绝对 值 输出 到 
显示 带 的 程序 的 内 存 状态 。 程 序 运 行 的 开始 位 置 是 0100 地 址 。 随 着 程 
序 计数 器 数值 的 增加 ， 当 到 达 0102 地 址 时 ， 如 果 累 加 寄存 器 的 值 是 正 
数 ， 则 执行 跳 转 指令 ( jump 指令 ) 跳 转 到 0104 地 址 。 此 时 ， 由 于 累加 
寄存 器 的 值 是 123， 为 正 数 ， 因 此 0103 地 址 的 指令 被 跳 过 ， 程 序 的 流 
程 直接 跳 转 到 了 0104 地 址 。 也 就 是 说 ,“ 跳 转 到 0104 地 址 ”这 个 指令 
间接 执行 了 “将 程序 计数 顺 设 定 成 0104 地 址 ”这 个 操作 。 


程序 计数 器 
数值 的 变化 地 址 内 存 中 的 内 容 
0100 0100 


0101 WIIOI 
O0102 0102 
0104 的 vnN08 
0105 程 0104 
os 
0106 


1-5 执行 条 件 分 支 的 程序 示例 ( 显示 绝对 值 ) 


条 件 分 文 和 循环 中 使 用 的 跳 转 指 令 ， 会 参照 当前 执行 的 运算 结 采 
来 判断 是 否 跳 转 。 表 1-1 所 列 出 的 寄存 天 中 ， 我 们 提 到 了 标志 寄存 条。 


由 溢出 (overflow ) 是 指 运算 的 结果 超出 了 寄存 器 的 长 度 范 围 。 
@ 奇偶 校 验 (parity check ) 是 指 检查 运算 结果 的 值 是 偶数 还 是 奇数 。 
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CPU 在 进行 运算 时 ， 标 志 寄 存 器 的 数值 会 根据 运算 结果 自动 设 定 。 
条 件 分 支 在 跳 转 指令 前 会 进行 比较 运算 。 至 于 是 否 执行 跳 转 指令 ， 则 
由 CPU 在 参考 标志 寄存 器 的 数值 后 进行 判断 。 运 算 结 果 的 正 、 零 、 负 
三 种 状态 由 标志 寄存 器 的 三 个 位 ”表示 。 图 1-6 是 32 位 CPU (寄存 器 的 
长 度 是 32 位 ) 的 标志 寄存 器 的 示例 。 标 志 寄存 器 的 第 一 个 字 节 位 、 第 
二 个 字 节 位 和 第 三 个 字 节 位 的 值 为 1 时 ， 表 示 运 算 结果 分 别 为 正 数 、 
去 和 负数 。 


图 1-6 ”比较 运算 的 结果 存储 在 标志 寄存 器 的 三 个 位 中 


CPU 执行 比较 的 机 制 很 有 意思 ， 因 此 请 大 家 务必 牢记 。 例如， 假 
设 要 比较 累加 寄存 器 中 存储 的 XXX 值 和 通用 寄存 器 中 存储 的 YYY 
值 ， 执 行 比 较 的 指令 后 ，CPU 的 运算 装置 就 会 在 内 部 (暗中 ) 进行 
XXX -YYY 的 减法 运算 。 而 无 论 减法 运算 的 结 末 是 正 数 、 零 还 是 负数 ， 
都 会 保存 到 标志 寄存 器 中 。 结 果 为 正 表 示 XXX 比 YYY 大 ， 和 零 表 示 
XXX 和 YYY 相等 ， 负 表示 XXX 比 YYY 小 。 杀 序 昌 的 到 较 指 2 站 
妊 和 0 于 二 讲 ， 怎 么 样 ， 是 不 是 挺 有 意思 的 ? 


(DD 1 位 (bit=binary digit ) 就 是 一 个 位 数 的 二 进 制 数 ， 表 示 0 或 1 的 数值 。32 
位 CPU 指 的 就 是 用 32 位 的 二 进 制 数 来 表示 数据 及 地 址 的 数值 。 关 于 二 进 
制 数 的 详细 内 容 ， 请 读者 参阅 第 2 章 。 
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哮 1.5 函数 的 调用 机 制 

接 下 来 ， 我 们 继续 介绍 程序 的 流程 。 哪 怕 是 高 级 语言 编写 的 程序 ， 
函数 ”调用 处 理 也 是 通过 把 程序 计数 器 的 值 设 定 成 函数 的 存储 地 址 来 实 
现 的 。 不 过 ， 这 和 条 件 分 支 、 循 环 的 机 制 有 所 不 同 ， 因 为 单纯 的 跳 转 指 
令 无 法 实现 函数 的 调用 。 函 数 的 调用 需要 在 完成 函数 内 部 的 处 理 后， 处 
理 流程 再 返回 到 函数 调用 点 ( 函数 调用 指令 的 下 一 个 地 址 )。 因 此 ， 如 
果 只 是 跳 转 到 函数 的 入 口 地 址 ， 处 理 流程 就 不 知道 应 该 返回 至 哪里 了 。 


图 1-7 是 给 变量 a 和 5 分 别 代 入 123 和 456 后 ， 将 其 赋值 给 参数 
( parameter ) 来 调用 MyFunc 因数 的 C 语言 程序 。 图 中 的 地 址 是 将 C 语 
言 编译 成 机 口语 言 后 运行 时 的 地 址 。 由 于 1 行 C 语言 程序 在 编译 后 通 
常会 变 成 多 行 的 机 器 语言 ， 所 以 图 中 的 地 址 是 离散 的 。 


此 外 ， 通 过 跳 转 指 令 把 程序 计数 器 的 值 设 定 成 0260 也 可 实现 调用 
MyFunc 也 数 。 函 数 的 调用 原点 (0132 地 址 ) 和 被 调用 函数 (0260 地 
址 ) 之 间 的 数据 传递 ， 可 以 通过 内 存 或 寄存 硕 来 实现 。 不 过 ， 当 函数 处 
理 进行 到 最 后 的 0354 地 址 时 ， 我 们 知道 应 该 将 程序 计数 融 的 值 设 定 成 
也 数 调 用 后 要 执行 的 0154 地 址 ， 但 实际 上 这 一 操作 根本 无 法 实现 。 那 
么 ， 怎么 办 才 好 呢 ? 


机 大 语言 的 call 指令 和 return 指令 能 够 解决 这 个 问题 。 建 议 大 家 把 
二 者 结合 起 来 来 记忆 。 癸 闭 调 用 俩 用 的 二 CI 指 窟 本 而 不 是 琵 转 指 委 辐 


在 将 函数 的 入 口 地 址 设 定 到 程序 计数 带 之 前 ，call 指令 会 把 调用 函数 后 


由 很 多 高 级 编程 语言 都 采用 类 似 于 y=f(x) 这 样 的 数学 函数 的 语法 来 记述 编写 
处 理 。 我 们 知道 ， 该 数学 函数 的 意思 是 将 x 这 个 值 通过 /处 理 后 得 到 数值 
y。 如 果 套 用 函数 的 语法 ,xX 就 是 参数 , y 就 是 返回 值 ， 执行 函数 的 功能 就 
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要 执行 的 指令 地 址 存储 在 名 为 栈 “的 主 存 内 。 函 数 处 理 完毕 后 ， 再 通过 
函数 的 出 口 来 执行 return 命令 。EEHUm 命令 的 荔 能 是 把 保 春 在 栈 节 的 而 
佬 交 定型 | 生计 灼 天 时 如 图 1-7 所 示 ，MyFunc 函数 被 调用 之 前 ， 
0154 地 址 保存 在 栈 中 。MyFunc 函数 的 处 理 完 毕 后 ， 栈 中 的 0154 地 址 
束 会 被 读 取 出 来 ， 然 后 再 被 设 定 到 程序 计数 带 中 (图 1-8 )。 


曲 
本 


函数 的 调用 
( 跳 转 到 0260 地 址 ) 


Gall 指 仿 


returnis 信 


Oll 
0 
区 


函数 的 出 口 
( 返回 到 0154 地 址 ) 


1-7 ”程序 调用 函数 示例 ( 这 里 直接 展示 了 C 语言 的 源 代 码 ， 实 际 上 各 地 址 存储 的 
应 该 是 变换 成 机 器 语言 后 的 程序 ) 


Q) 栈 (stack ) 本 来 是 “干草 等 堆积 如 山 ” 的 意思 。 在 程序 领域 中 ， 通 常 使 用 
ve perm 函数 调用 后 之 所 以 能 正确 
地 返回 调用 前 的 地 址 ， 就 是 栈 的 功劳 。 关 于 栈 ， 我 们 会 在 第 4 章 进 行 详细 
说 明 。 


© 图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


(i peallhe 
CPU 返回 目的 地 


内 存 
三 仿 二 下 所 可 


ee 
通过 把 函数 调用 的 地 址 0260 


设 定 在 程序 计数 器 上 ， 来 跳 
转 到 该 函数 进行 处 理 


(2 7 retrornie 
CPU 


旦 序 的 栈 区 域 
通过 把 返回 目的 地 的 地 址 : 
0154 设 定 在 程序 计数 器 上 ， 
来 跳 转 到 该 函数 的 调用 元 地 
址 进行 处 理 


”图 1-8 ”函数 调用 中 程序 计数 器 和 栈 的 职能 


在 编译 高 级 编程 语言 的 程序 后 ， 吗 数 调用 的 处 理会 转换 成 call 指 
函数 结束 的 处 理 则 会 转换 成 return 指令 。 这 样 一 来 ， 程 序 的 运行 也 
FE 常 流 畅 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 名 


天 1.6 ”通过 地 址 和 索引 实现 数组 
接 下 来 我 们 看 一 下 表 1-1 中 出 现 的 基 址 寄存 器 和 变 址 寄存 器 。 通 过 


这 两 个 寄存 器 ， 我 们 可 以 对 主 内 存 上 特定 的 内 存 区 域 进行 划分 ， 从 而 
实现 类 似 于 数组 “的 操作 。 


首先 ， 我 们 用 十 六 进 制 数 “ 将 计算 机 内 存 上 00000000~-FFFFEFFEFF 
的 地 址 划分 出 来 。 那 么 ， 几 是 该 范围 的 内 存 区 域 ， 只 要 有 一 个 32 位 的 
寄存 器 ， 即 可 查看 全 部 的 内 存 地 址 。 但 如 果 想 要 像 数 组 那样 分 割 特 
定 的 内 存 区 域 以 达到 连续 查看 的 目的 ， 使 用 两 个 寄存 器 会 更 方便 
些 。 例 如 ， 查 看 10000000 地 址 一 1000FFFF 地 址 时 ， 如 图 1-9 所 示 ， 
可 以 将 10000000 存 入 基 址 寄存 带 ， 并 使 变 址 寄存 瘟 的 值 在 
00000000~0000FFFF 变化 。CPU 则 会 把 基 址 寄存 器 + 变 址 寄存 大 的 值 
解释 为 实际 查看 的 内 存 地 址 。 蔗 王 寄 下 串 的 信和 就 相当 二 高 级 编程 语言 
程序 中 数组 的 索引 功能 。 


(DD 数组 是 指 同样 长 度 的 数据 在 内 存 中 进行 连续 排 


列 的 数据 构造 。 用 一 个 数组 名 来 表示 全 体 数 四 
着 ， 通 过 宕 下 来 区 分 数组 的 各 个 部 据 (元 素 )。 有 0 个 es 
例如 ， 一 个 10 个 元 素 的 数组 a， 其 中 的 各 个 竹 组 。 | 
数据 就 用 a[0]~a[9] 来 表示 。[] 内 的 数字 0 一 9 四 
… 元 素 al9] 


就 是 索引 。 

@ 二 进 制 数 的 位 数 较 多 、 不 易 理解 时 ， 通 常 使 用 十 六 进 制 数 来 代替 二 进 制 数 。 
这 是 一 种 数 到 16 就 进位 的 计数 方式 。 我 们 用 A~F 来 分 别 表 示 10 一 15， 那 
么 ， 二 进 制 数 的 4 位 (0000 ~EFFFF ) 就 可 以 用 十 六 进 制 数 的 1 位 (0~F) 
来 表示 。32 位 的 二 进 制 数 ， 就 可 以 用 8 位 的 十 六 进 制 数 来 表示 。 
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实际 地 址 = 基 址 寄存 器 的 值 + 变 址 寄存 器 的 值 
固定 


10000000 
la -一 相当 于 数组 
10000001 UUUUUUU 1 | 索引 的 数值 


10000002 


oo 


1-9 综合 使 用 地 址 和 索引 来 决定 实际 地 址 


转 1.7 CPU 的 处 理 其 实 很 简单 

可 能 有 些 读者 不 知道 机 器 语言 和 汇编 语言 的 指令 到 底 有 多 少 种 ， 
因而 对 CPU 的 运行 没什么 概念 。 为 了 消除 大 家 心中 的 这 个 疑 团 ， 接 下 
来 我 们 就 来 看 一 下 机 器 语言 到 底 有 哪些 种 类 。 表 1-2 按照 功能 对 CPU 
能 执行 的 机 器 语言 指令 进行 了 大 体 分 类 。 这 里 没有 列 出 指令 的 具体 名 
称 (全 及 语 计 的 助 启 御 )， 看 完 表 后 你 会 惊奇 地 发 现 ， 原 来 CPU 可 以 进 
行 的 处 理 非常 少 。 虽 然 高 级 编程 语言 编写 的 程序 看 起 来 非常 复杂 ， 但 
CPU 实际 处 理 的 事情 就 是 这 么 简单 。 这 样 一 来 ， 大 家 是 不 是 能 够 消除 
“计算 机 机 制 看 起 来 很 难 ” 这 个 印象 了 呢 ? 


表 1-2 机 器 语言 指令 的 主要 类 型 和 功能 


类 型 功 能 
国 汉 入 D> 河 抽 其 坦 尘 
数据 转送 指令 人 内 存 和 内 存 、 寄 存 器 和 外 围 设备 之 间 的 数据 读 
运算 指令 用 累加 寄存 器 执行 算术 运算 、 逻 辑 运 算 、 比 较 运 算 和 移 位 运算 
跳 转 指 令 实现 条 件 分 支 、 循 环 、 强 制 跳 转 等 


call/return 指令 函数 的 调用 / 返回 调用 前 的 地 址 


Q) ， 外围 设备 指 的 是 连接 到 计算 机 的 键盘 、 和 鼠标 、 显 示 器 、 设 备 装 置 、 打 印 机 等 。 
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如 末 大 家 读 完 上 文 后 有 种 悦 然 大 情 的 感觉 ， 对 程序 的 运行 机 制 有 
了 一 个 整体 的 印象 ， 那 么 本 书 的 目的 也 就 达到 了 。 只 要 对 程序 的 运行 
机 制 有 了 一 个 整体 印象 ， 相 信 大 家 的 编程 能 力 和 应 用 能 力也 会 快速 得 
到 提高 。 现 在 再 看 之 前 写 出 来 的 程序 ， 是 不 是 感觉 它们 也 变 得 活 灵 活 


0 


现 了 呢 ? 


本 章 在 介绍 标志 寄存 华 时 ， 提 到 过 “位 ”这 个 专业 术语 。1 位 代表 
二 进 制 数 的 一 个 字 贡 位， 这 一 点 对 了 解 计算 机 的 运算 机 制 非常 重要 。 
在 下 一 章 中 ， 我 们 将 以 位 为 基础 ， 回 大 家 介绍 一 下 二 进 制 数 和 译 点 数 
这 些 数 据 形式 ， 以 及 逻辑 运算 和 位 操作 等 相关 知识 。 
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HI 抽身 | 问答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


1. 32 位 是 几 个 字 节 ? 

2. 二 进 制 数 01011100 转换 成 十 进 制 数 是 多 少 ? 

3. 二 进 制 数 00001111 左 移 两 位 后 ， 会 变 成 原 数 的 几 倍 ? 

4. 补 码 形式 表示 的 8 位 二 进 制 数 11111111， 用 十 进 制 数 表 示 
的 话 是 多 少 ? 

5. 补 码 形式 表示 的 8 位 二 进 制 数 10101010， 用 16 位 的 二 进 
制 数 表示 的 话 是 多 少 ? 


器 \ 一 AAA 一 


6. 反 转 部 分 图 形 模 式 时 ， 使 用 的 是 什么 逻辑 运算 ? 
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VAAN 


Yo 


么 样 ? 是 不 是 发 现 有 一 些 问 题 无 法 简单 地 解释 清楚 呢 ? 下面 
是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


92 
4 信 
| 


. 1111111110101010 
. XOR 运算 


.因为 8 位 =1 字 节 ， 所 以 32 位 就 是 32 :8=4 字 节 。 
. 将 二 进 制 数 的 各 数位 的 值 和 位 权 相 乘 后 再 相 加 ， 即 可 转换 成 十 


进 制 数 。 


.二进制 数 左 移 1 位 后 会 变 成 原来 的 值 的 2 倍 。 左 移 两 位 后 ， 就 


是 2 售 的 2 信 ， 即 4 倍 。 


.所 有 位 都 是 1 的 二 进 制 数 ， 用 十 进 制 数 表示 的 话 就 是 -1。 
. 使 用 原 数 的 最 高 位 1 来 填充 高 位 。 
. XOR 运算 只 反 转 与 1 相对 应 的 位 。NOT 运算 是 反 转 所 有 的 位 。 
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要 想 对 程序 的 运行 机 制 形 成 一 个 大 致 印象 ， 就 要 
了 解 信息 ( 数据 ) 在 计算 机 内 部 是 以 怎样 的 形式 来 表现 
的 ， 又 是 以 怎样 的 方法 进行 运算 的 。 在 C 和 Java 等 高 级 语言 编写 的 
程序 中 ， 数 值 、 字 符 串 和 图 像 等 信息 在 计算 机 内 部 都 是 以 二 进 制 数值 
的 形式 来 表现 的 。 也 就 是 说 ， 只 要 掌握 了 使 用 二 进 制 数 来 表示 信息 的 
方法 及 其 运算 机 制 ， 也 就 自然 能 够 了 解 程序 的 运行 机 制 了 。 那 么 ， 为 
什么 计算 机 处 理 的 信息 要 用 二 进 制 数 来 表示 呢 ? 接 下 来 我 们 就 从 其 原 
因 开始 说 起 。 


团 2.1 用 二 进 制 数 表示 计算 机 信息 的 原因 

想必 大 家 都 知道 计算 机 内 部 是 由 IC 这 种 电子 部 件 构成 的 。 第 1 章 
介绍 的 CPU( 微 处 理 器 ) 和 内 存 也 是 IC 的 一 种 。IC 有 几 种 不 同 的 形状 ， 
有 的 像 一 条 黑色 蚂 肉 ， 在 其 两 侧 有 数 个 力 至 数 百 个 引 脚 ， 有 的 则 像 插 花 
用 的 针 盘 ， 引 脚 在 IC 内 部 并 排 排 列 着 . @ 的 所 有 有 引 膨 吧 胡 于 议 直 局 
册 动 卫 WW 也 就 是 说 ，IC 的 一 个 引 脚 ， 只 能 表示 两 个 状态 。 

IC 的 这 个 特性 ， 决 定 了 计算 机 的 信息 数据 只 能 用 二 进 制 数 来 处 理 。 
由 于 1 位 (一 个 引 脚 ) 只 能 表示 两 个 状态 ， 所 以 二 进 制 的 计数 方式 就 变 
成 了 0、1、10、11、100… 这 种 形式 。 虽 然 二 进 制 数 并 不 是 专门 为 IC 
而 设计 的 ， 但 是 和 IC 的 特性 非常 吻合 ( 图 2-1 ), 便 博得 情 是 的 二 


D (有 和 ERROREACICUULO 合 用 沪 模拟 IC 和 数字 IC 两 种 。 林 


章 介 绍 的 是 数字 IC。 关 于 内 存 IC， 我 们 会 在 第 4 章 详细 说 明 。 
@) 大 部 分 IC 的 电源 电压 都 是 +SV。 不 过 ， 为 了 控制 电量 的 消耗 ， 有 的 IC 也 
人 和信 


会 使 用 +SV 以 下 的 电压 。 如 果 IC 使 用 的 电源 电压 为 +53V， 那 么 引 脚 状态 
就 不 只 是 0V 和 +5V， 还 存在 不 接收 电流 信号 的 高 阻抗 (high impedance ) 
状态 。 但 在 本 书 中 ， 我 们 暂时 不 考虑 高 阻抗 状态 。 
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年 证 1 位 的 英文 bit 是 二进制 数位 
( binary digit ) 的 缩写 。 


EE / 


1 四 1 机 . 8 个 引 脚 


! ' | | … 8 位 二 进 制 数 


二 进 制 数 的 位 数 一 般 是 8 位 、16 位 、32 位 …… 也 就 是 8 的 倍数 ， 

这 是 因为 计算 机 所 处 理 的 信息 的 基本 单位 是 8 位 二 进 制 数 。 加 全 于 囊 制 
二 ”， 字 季 是 最 基本 的 信息 计量 单位 。 位 是 最 小 单位 ， 
字 节 是 基本 单位 。 内 存 和 磁盘 都 使 用 字 节 单位 来 存储 和 读 写 数据 ， 使 
用 位 单位 则 无 法 读 写 数据 。 因 此 ， 字 节 是 信息 的 基本 单位 。 


字 节 单位 处 理 数据 时 ,全 时 数 字 j 于 存储 多 据 的 导 旨 类 国生 过 

ee 例如 ，100111 这 个 6 位 二 进 制 

数 ， 用 8 位 (=1 字 节 ) 表示 时 为 00100111, 用 16 位 (= 2 字 节 ) 表示 

时 为 0000000000100111。 奔 腾 等 32 位 微 处 理 器 ， 具 有 32 个 引 脚 以 用 

于 信息 的 输入 和 输出 。 也 就 是 说 ， 奔 腾 一 次 可 以 处 理 32 位 (32 位 =4 
字 节 ) 的 二 进 制 数 信息 。 


(DD 字 节 是 由 bite ( 咬 ) 一 词 而 衍生 出 来 的 词语 。8 位 (8 bit ) 二 进 制 数 ， 就 类 
似 于 “ 咬 下 的 一 口 ， 因 此 被 视 为 信息 的 基本 单位 。 
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程序 中 ， 即 使 是 用 十 进 制 数 和 文字 等 记述 信息 ， 在 编 详 后 也 会 转 
换 成 二 进 制 数 的 值 ， 所 以 ， 程 序 运 行 时 计算 机 内 部 处 理 的 也 是 用 二 进 
制 数 表示 的 信息 (图 2-2 )。 


~ ss 编译 一 一 ^\ ss 
39 ( 十进制 数 ) 00100111 ( 二 进 制 数 ) 
A > 01000001 ( 二 进 制 数 ) 


图 2-2 计算 机 内 部 所 有 信息 都 用 二 进 制 数 处 理 


对 于 用 二 进 制 数 表 示 的 信息 ， 计 算 机 不 会 区 分 它 是 数值 、 文 字 ， 
还 是 某 种 图 片 的 模式 等 ， 而 是 根据 编写 程序 的 各 位 对 计算 机 发 出 的 指 
示 来 进行 信息 的 处 理 (运算 )。 例 如 00100111 这 样 的 二 进 制 数 ， 既 可 以 
视 为 纯粹 的 数值 作 加 法 和 运算， 也 可 以 视 为 “”( 单 引号 ，single 
quotation ) 文字 而 显示 在 显示 需 上 ， 或 者 视 为 国 硬 器 国 国 中 器 口 这 一 网 
形 模式 印刷 出 来 。 具 体 进行 何 种 处 理 ， 取 决 于 程序 的 编写 方式 。 


团 2.2 什么 是 二 进 制 数 

什么 是 二 进 制 数 ”为 了 更 清晰 地 说 明 二 进 制 数 的 机 制 ， 首 先 让 我 
们 把 00100111 这 个 二 进 制 数值 转换 成 十 进 制 数 值 来 看 一 下 。 二 进 制 数 
的 值 转换 成 十 进 制 数 的 值 ， 只 需 将 二 进 制 数 的 各 数位 的 值 和 位 权 相 乘 ， 
然后 将 相 乘 的 结果 相 加 即 可 ( 图 2-3 )。 


假使 有 人 问 你 : ”为 什么 使 用 这 样 的 转换 方法 呢 ? 你 能 解释 一 下 
吗 ?” 你 这 么 回答 是 不 行 的: 不 知 近 原因 ， 只 是 把 方法 育 下 来 了 。 我 
们 了 解 了 二 进 制 数 的 机 制 后 ， 再 看 二 进 制 数 转换 成 十 进 制 数 的 方法 ， 
就 没有 死记 重 育 的 必要 了 。 下 面 我 们 会 对 照 着 十 进 制 效 来 说 明 二 进 制 
数 的 机 制 ， 这 部 分 是 重点 ,请 大 家 一 定 要 掌握 。 
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001001111( 一 进 币 政 \ 


(Ox2)+(0x2%)+(1x2°)+(0x2%)+(0x23)+(1x2)+(1x2)+(1 x2° 
(Ox128)+(0x64)+(1x32)+(0x16)+(0x8)+(1x4)+(1x2)+(1x1) 
O+0O0+32+0+0+4+2+1 

39 ( 十进制 数 ) 


图 2-3 "二进制 数 转换 成 十 进 制 数 的 方法 


首先 ， 让 我 们 从 位 权 的 含义 说 起 。 例 如 ， 十 进 制 数 39 的 各 个 数位 
的 数值 ， 并 不 只 是 简单 的 3 和 9， 这 点 大 家 应 该 都 知道 。3 表示 的 是 
3x10 = 30, 9 表示 的 是 9x1 = 9。 这 里 和 各 个 数位 的 数值 相 乘 的 10 和 
1， 就 是 位 权 。 数 字 的 位 数 不 同 ， 位 权 也 不 同 。 第 1 位 ( 最 右边 的 一 位 ) 
是 10 的 0 次 曙 (=1), 第 2 位 是 10 的 1 次 短 (=10), 第 3 位 是 10 的 
2 次 需 (= 100 )， 依 此 类 推 。 这 部 分 相信 大 家 都 能 够 理解 。 那 么 ， 我 们 
就 继续 讲 一 下 二 进 制 数 。 


位 权 的 思考 方式 也 同样 适用 于 二 进 制 数 。 即 第 1 位 是 2 的 0 次 宕 
1 第 2 位 证 2 时]T 次 晤 (二 2) 第 3 位 是 2 的 2 次 晤 (全 4 入 ws 
第 8 位 是 2 的 7 次 宕 (= 128) “OO 的 x x 次 宕 ”表示 位 权 ， 其 中 ， 
十 进 制 数 的 情况 下 OO 部 分 为 14， 二进制 数 的 情况 下 则 为 2。 这 个 称 
为 基数 “。 十 进 制 数 是 以 10 为 基数 的 计数 方法 , 二 进 制 数 则 是 以 2 为 基 
数 的 计数 方法 “OO 的 x x 次 宕 ”中 的 x x ， 在 任何 进 制 数 中 都 是 
QD 所 有 数 的 0 次 暴 都 是 1。 


@ 数值 的 表现 方法 ， 进 位 计数 制 中 各 数位 上 可 能 有 的 数值 的 个 数 。 十 进 制 数 
的 基数 是 10， 二 进 制 数 的 基数 是 2。 
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' 数 的 位 数 -1"。 即 第 1 位 是 1- 1= 0 次 宕 ,第 2 位 是 2-1= 1 次 宕 ， 


第 3 位 是 3-1=?2 次 寡 。 


接 下 来 ， 让 我 们 来 解释 一 下 各 数位 的 数值 和 位 权 相 乘 后 “ 相 加 ”这 
个 处 理 的 原因 。 其 实 大 家 所 说 的 数值 ， 表 示 的 就 是 构成 数值 的 各 数位 
的 数值 和 位 权 相 乘 后 再 相 加 的 结 朱 。 例 如 39 这 个 十 进 制 数 ， 表 示 的 就 
是 30+9， 即 各 数位 的 数值 和 位 权 相 乘 后 再 相 加 的 数值 。 


这 种 思考 方式 在 二 进 制 数 中 也 是 通用 的 。 二 进 制 数 00100111 用 十 进 
制 数 表示 的 话 是 39， 因 为 (0x128)+ (0x64)+(1x32)+(0x16) 
+ (0x8)+(1x4)+(1x2)+ (1x1)=39。 大 家 明白 了 吗 ? 


国 2.3 移 位 运算 和 乘除 运算 的 关系 

在 了 解 了 二 进 制 数 的 机 制 后 ， 接 下 来 我 们 来 看 一 下 运算 。 和 十 进 
制 数 一 样 ， 四 则 运算 同样 也 可 以 使 用 在 二 进 制 数 中 ， 只 要 注意 着 2 进 
位 即 可 。 下 面 ， 我们 就 来 重点 看 一 下 二 进 制 数 所 特有 的 运算 。 二 进 制 
数 所 特有 的 运算 ， 也 是 计算 机 所 特有 的 运算 ， 因 此 可 以 说 是 了 解 程序 
运行 原理 的 关键 。 


首先 我 们 来 介绍 移 位 运算 。 移 位 运算 指 的 是 将 二 进 制 数值 的 各 数 
位 进行 左右 移 位 (shift = 移 位 ) 的 运算 。 移 位 有 左 移 (向 高 位 方 同 ) 
和 右 移 ( 回 低位 方向 ) 两 种 。 在 一 次 运算 中 ， 可 以 进行 多 个 数位 的 移 
位 操作 。 


代码 清单 2-1 中 列 出 的 是 把 变量 a 中 保存 的 十 进 制 数值 39 左 移 两 
位 后 再 将 运算 结果 存储 到 变量 5 中 的 C 语言 程序 。<< 这 个 运算 符 表示 
左 移 ， 看 移 时 使 用 >> 运算 符 。<< 运算 符 和 > 运算 符 的 左 侧 是 被 移 位 
的 值 ， 右 侧 表示 要 移 位 的 位 数 。 那 么 ， 这 个 示例 程序 运行 后 ， 变 量 ， 
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的 值 是 多 少 ， 大 家 知道 吗 ? 


代码 清单 2-1 将 变量 a 的 值 左 移 两 位 的 C 语言 程序 


a 
三 本 && 2p 


如 果 你 认为 “由 于 移 位 运算 是 针对 二 进 制 数 值 的 位 操作 ， 十 进 制 数 
39 的 移 位 操作 就 行 不 通 了 ”， 那 么 就 请 重新 读 一 下 本 章 的 内 容 。 无 论 程 
序 中 使 用 的 是 几 进 制 ， 计 算 机 内 部 都 会 将 其 转换 成 二 进 制 数 来 处 理 ， 
因此 都 能 进行 移 位 操作 。 但 是 ,“ 左 移 后 空 出 来 的 低位 ， 要 补 上 什么 样 
的 数值 呢 ?” 想 到 这 个 问题 的 人 真是 思维 敏 镜 ! 空 出 来 的 低位 要 进行 补 
0 操作 。 不 过 ， 这 一 规则 只 适用 于 左 移 运 算 。 至 于 右 移 时 空 出 来 的 高 位 
要 进行 怎样 的 操作 ， 我 们 会 在 后 面 说 明 。 此 外 ， 移 位 操作 使 最 高 位 或 
最 低位 溢出 的 数字 ， 下 接 丢 弃 就 可 以 了 。 

接 下 来 让 我 们 继续 来 看 代码 清单 2-1。 十 进 制 数 39 用 8 位 的 二 进 制 
表示 是 00100111， 左 移 两 位 后 是 10011100， 再 转换 成 十 进 制 数 就 是 156。 
不 过 这 里 没有 考虑 数值 的 符号 。 至 于 其 原因 ， 之 后 大 家 就 知道 了 。 


“(DD FD FY YF 区 痢 -39 


AAA 


AOALAOLAOAOAOALAOALE 移 位 后 = 156 


空 出 来 的 低位 补 0 


图 2-4 左 移 两 位 的 运算 
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实际 的 程序 中 ， 移 位 运算 以 及 将 在 本 和 草 最 后 介绍 的 逻辑 运算 在 使 
用 位 单位 处 理 信 息 的 情况 下 比较 常用 。 虽 然 这 里 没有 列举 具体 的 程序 
示例 ， 但 对 程序 员 来 说 ， 掌 握 位 运算 和 逻辑 运算 的 机 制 是 一 项 基本 技 
能 ， 所 以 一 定 要 掌握 。 形 象 地 说 ， 移 位 运算 就 好 比 使 用 二 进 制 表示 的 
图 片 模式 像 洗 虹 灯 一 样 左右 流动 的 样子 。 
， 移 位 运算 也 可 以 通过 数位 移动 来 代替 乘法 运算 和 除法 运算 。 
pa 和 ss 吉 果 是 10011100， 左 移 两 位 后 数值 变 成 
了 原来 的 4 倍 。 用 十 进 制 数 表示 的 话 ， 数 值 从 39 (00100111 ) 变 成 了 
156( 10011100 )， 也 正好 是 4 倍 (39x4=156 )。 


其 实 ， 反复 思考 儿 遍 后 就 会 发 现 确实 如 此 。 时 进 制 数 帮 移 后 会 开 


这 样 一 来 ， 大 家 应 该 能 够 理解 为 什么 移 位 运算 能 代替 
乘法 运算 和 除法 运算 了 吧 。 


转 2.4 便于 计算 机 处 理 的 “ 补 数 ” 

刚才 之 所 以 没有 介绍 有 关 右 移 的 内 容 ， 是 因为 用 来 填充 右 移 后 空 
出 来 的 高 位 的 数值 ， 有 0 和 1 两 种 形式 。 要 想 区 分 什么 时 候补 0 什么 
时 候补 1， 只 要 和 擎 握 了 用 二 进 制 数 表示 负数 的 方法 即 可 。 这 部 分 内 容 较 
多 ， 接 下 来 我 们 就 一 起 来 看 看 表示 负数 的 方法 和 右 移 的 方法 。 


ye -1 用 8 位 二 进 制 数 来 表示 的 话 是 什么 样 的 呢 ? 可 
很 多 人 会 认为 “1 的 二 进 制 数 是 00000001， 因 此 -1 就 是 10000001”， 
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但 这 个 答案 是 错 的 ， 正 确 答案 是 11111111。 


计算 机 在 做 减法 运算 时 ,实际 上 内 部 是 在 做 加 法 运算 。 用 加 法 
伍 算 床 实 现 芽 于 运 缚 ， 是 不 是 很 新 奇 呢 ? 为 此 , 莉 表 未 多 数 辐 于 二 
要 使 用 “二 进 制 的 补 数 "。 补 数 就 是 用 正 数 来 表示 负数 ， 很 不 可 思 
ge 

为 了 获得 补 数 ， 我 们 需要 将 二 进 制 数 的 各 数位 的 数值 全 部 取 反 ， 
然后 再 将 结果 加 1。 例如， 用 8 位 二 进 制 数 表示 -1 时 ， 只 需求 得 1， 
也 就 是 00000001 的 补 数 即 可 。 具 体 来 说 , 二 是 将 友 效 从 的 0 到 反动 @ 


人 0 轴 到 万 0 办 后 二 和 询 友 的 缚 壬 而 贱 ， 最 后 就 转化 成 了 11111111 
(图 2-5 )。 


多 (多 (YY 


AAA A A A" 


Y 


SADADABSASASASAVSD 1, Kr 


补 数 完成 


图 2-5 获取 00000001 的 补 数 的 方法 
补 数 的 思考 方式 ,虽然 直观 上 不 易 理解 ， 但 逻辑 上 却 非常 严谨 。 


(DD 这 里 所 说 的 取 反 是 指 ， 把 二 进 制 数 各 数位 的 0 变 成 1，1 变 成 0。 例 如 
00000001 这 个 8 位 二 进 制 数 取 反 后 就 成 了 11111110。 
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例如 1-1， 也 就 是 1+(- 了 1 这 一 运算 ， 我 们 都 知道 答案 应 该 是 0。 首 
先 ， 让 我 们 将 -1 表示 成 10000001 ( 错误 的 表示 方法 ) 来 运算 ， 看 看 结 
果 如 何 。00000001 +10000001 = 10000010， 很 明显 结果 不 是 0 (网 
2-6 )。 如 果 结 果 是 0， 那么 所 有 的 数位 都 应 该 是 0 才 对 。 


00000001 … 1 的 表示 方法 是 正确 的 
+ 10000001 … -1 的 表示 方法 是 错误 的 
10000010 … 1+(-1) 的 运算 结果 不 为 0， 是 错误 的 


ii 


接 下 来 ， 让 我 们 把 -1 表示 成 11111111 (正确 的 表示 方法 ) 来 进行 
运算 。 00000001 + 11111111 确实 为 0 (= 00000000 )。 这 个 运算 中 出 现 
了 最 高 位 溢出 的 人 情况， 不过， 正如 之 前 所 介绍 的 那样 ， 对 于 溢出 的 位 ， 
计算 机 会 下 接 忽 略 掉 。 在 8 位 的 范围 内 进行 计算 时 ，100000000 这 个 9 
位 二 进 制 数 就 会 被 认为 是 00000000 这 一 8 位 二 进 制 数 (图 2-7 ), 


00000001 … 1 的 表示 方法 是 正确 的 
+11111111 … -1 的 表示 方法 是 正确 的 
400000000 … 1+(-1) 的 运算 结果 为 0， 是 正确 的 


这 个 位 溢出 会 被 忽略 


图 2-7 ”负数 表示 正确 时 的 情况 


补 数 求 解 的 变换 方法 就 是 “ 取 反 + 1”"。 为 什么 使 用 补 数 后 就 能 正确 
地 表示 人 负数 了 呢 ? 为 了 加 深 印 象 ， 我 们 来 看 一 下 图 2-7 ， 与 此 同时 也 硕 
望 大 家 能 够 牢记 “将 二 进 制 数 的 值 取 反 后 加 1 的 结果 ， 和 原来 的 值 相 
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加 , 结果 为 0” 这 一 法 则 。 首 先 , 大 家 可 以 用 1 和 -1 的 二 进 制 形 式 , 来 彻 
底 地 了 解 补 数 的 相关 内 容 。 除 了 1+(-1) 之 外 ，2+(-2)、39+(-39) 等 
同样 如 此 。 总 之 ， 要 想 使 结果 为 0， 就 必须 通过 补 数 来 实现 。 


当然 ， 结 果 不 为 0 的 运算 同样 可 以 通过 使 用 补 数 来 得 到 正确 的 结 
果 。 不 过 ， 有 一 点 需要 注意 ， 当 运算 结果 为 负数 时 ,计算 结果 的 值 也 
是 以 补 数 的 形式 来 表示 的 。 比 如 3 -5 这 个 运算 ， 用 8 位 二 进 制 数 表示 
3 时 为 00000011， 而 5=00000101 的 补 数 为 “ 取 反 +1”"， 也 就 是 
11111011。 因 此 3 -5 其 实 就 是 00000011 +11111011 的 运算 。 


00000011+11111011 的 运算 结果 为 11111110， 最 高 位 变 成 了 1。 这 
就 表示 结 采 是 一 个 负数 ， 这 点 大 家 应 该 都 能 理解 。 那 么 11111110 表示 
的 负数 是 多 少 大 家 知道 吗 ? 这 时 我 们 可 以 利用 负 负 得 正 这 个 性 质 。 假 
若 11111110 是 负 人 入 人 入， 那么 11111110 的 补 数 就 是 正信 A 。 通 过 求解 补 
数 的 补 数 ， 就 可 知 该 值 的 绝对 值 。11111110 的 补 数 ， 取 反 加 1 后 为 
00000010。 这 个 是 2 的 十 进 制 数 。 因 此 ，11111110 表示 的 就 是 -2。 我 们 
也 就 得 到 了 3 - 5 的 正确 结果 (图 2-8 )。 


Www [IE，3 
1TITTTOTTEE 用 补 入 表示 的 5 


11111110 … 用 补 数 表 示 的 运算 结果 -2 


图 2-8 3-5 的 运算 结果 


(D 例如 ，00000001 和 取 反 后 的 11111110 相 加 ， 结 果 为 11111111， 全 部 数位 均 
为 1。 因此 ,， 比 11111110 大 1 的 数 加 上 00000001 后 ，11111111 变 为 9 位 的 


100000000， 由 于 在 8 位 的 范围 内 运算 时 第 9 位 会 被 计算 机 忽略 ， 因 此 结果 
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编程 语言 包含 的 整数 数据 类 型 ”中 ， 有 的 可 以 处 理 负 数 ， 有 的 则 不 
能 处 理 。 例 如 ，C 语言 的 数据 类 型 中 ， 既 有 不 能 处 理 负 数 的 unsigned 
short 类 型 ， 也 有 能 处 理 负 数 的 short 类 型 。 这 两 种 类 型 ， 都 是 2 字 节 
(=16 位 ) 的 变量 ， 都 能 表示 2 的 16 次 需 = 65536 种 值 ， 这 一 点 是 相同 
的 。 不 过 ， 值 的 范围 有 所 不 同 ，short 类 型 是 -32768~32767，unsigned 
short 类 型 是 0 一 6$53$。 此 外 ，short 类 型 和 unsigned short 类 型 的 另 一 
个 不 同 点 在 于 ，short 类 型 是 将 最 高 位 为 1 的 数值 看 作 补 数 ， 而 
unsigned short 类 型 则 是 32768 以 上 的 值 。 


仔细 思考 一 下 补 数 的 机 制 ， 大 家 就 会 明日 像 -32768 一 32767 这 样 
负数 比 正 数 多 一 个 的 原因 了 。 最 高 位 是 0 的 正 数 ， 有 0~32767 共 
32768 个 ， 这 其 中 也 包含 0。 最 高 位 是 1 的 负数 ， 有 -1 一 -32768 共 
32768 个 ， 这 其 中 不 包含 0。 也 就 是 说 , 加 相克 看 通 烦 渣 围 商量 所 网 阅 
数 就 要 比 正 数 多 1 个。 虽然 0 不 是 正 数 ， 但 考虑 到 符号 位 ， 就 将 其 划 
a 0 天 


2.5 ”逻辑 右 移 和 算术 右 移 的 区 别 
在 了 解 了 补 数 后 ， 让 我 们 返回 到 右 移 这 个 话题 。 前 文 已 经 介绍 过 ， 


Q) 多 数 编程 语言 都 会 把 数据 代入 变量 来 进行 处 理 。 变 量 中 会 指定 可 以 存储 的 
数值 的 种 类 ( 整数 还 是 小 数 ) 和 表示 数值 大 小 (位 数 ) 的 数据 类 型 。C 语言 
的 数据 类 型 中 ， 有 用 于 整数 的 char、unsigned char、short、unsigned short、 
int、unsigned int 和 用 于 小 数 的 float、double 等 。 关 于 数据 类 型 的 详细 内 
容 ， 我 们 会 在 第 4 章 进 行 说 明 。 
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洲 出 的 低位 被 忽略 掉 


1 


空 出 来 的 高 位 用 0 补 上 


图 2-9 图形 模 式 的 右 移 ( 罗 辑 右 移 ) 


将 二 进 制 数 作为 带 符 号 的 数值 进行 运算 时 ， 移 位 后 要 在 最 高 位 需 
充 移 位 前 符号 位 的 值 (0 或 1 )。 这 束 称 为 算术 右 移 。 如 果 数 值 是 用 补 
数 表示 的 负数 值 ， 那 么 右 移 后 在 空 出 来 的 最 高 位 补 1， 就 可 以 正确 地 


实现 12、L/4、1/8 等 的 数值 运算 三 遇 盏 SEE ER 自贡 检 这 BO 
即 可 。 

现在 我 们 来 看 一 个 右 移 的 例子 。 将 -4 (=11111100 ) 右 移 两 位 。 这 
时 ， 逻 辑 右 移 的 情况 下 结果 就 会 变 成 00111111， 也 就 是 十 进 制 数 63， 
显然 不 是 -4 的 1/4。 而 算术 石 移 的 情况 下 ， 结 果 就 会 变 成 11111111， 
用 补 数 表示 就 是 -1， 即 -4 的 /4 (图 2-10)。 
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@ 远 辑 右 移 


et 


空 出 来 的 高 位 用 0 填充 


移 位 后 =63 
@@ 算 数 右 移 
NSSSSS 
A@7@ ”0 @ @ @ @_ 
| 


移 位 后 = 一 1 


图 2-10 ”逻辑 右 移 和 算术 右 移 的 区 别 


下 面 顺便 介绍 一 下 符号 扩充 。 以 8 位 二 进 制 数 为 例 , 旺 瑟 芒 充 瑞 
将 
01111111 这 个 正 的 8 位 二 进 制 数 转换 成 16 位 二 进 制 数 时 ， 很 容易 就 能 
得 出 0000000001111111 这 个 正确 结果 ,但 是 像 11111111 这 样 用 补 数 来 
表示 的 数值 ， 该 如 何 处 理 比 较 好 呢 ? 实际 上 处 理 方法 非常 简单 ， 将 其 
表示 成 1111111111111111 就 可 以 了 。 也 就 是 说 , 蒜 管 是 下 数 还 是 用 视 
数 表示 的 负数 ， 都 只 需 用 符号 位 的 值 (0 或 者 1 ) 填充 高 位 即 可 。 这 就 
是 符号 扩充 的 方法 。 图 2-11 向 我 们 展示 了 将 符号 位 扩充 到 高 位 的 具体 


月 
流程 。 


< 
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用 8 伍 趟 示 的 127 
pAH HHH YY 
a 


用 16 位 表示 的 127 


用 8 位 表示 的 -1 
A "BO G6 
圈 河 


/只 需 用 符号 位 的 值 来 填充 高 位 即 可 
407070702020O20 @ 0@ 0@ 0@ @ @ @ 
用 16 位 表示 的 -1 


图 2-11 由 8 位 转换 成 16 位 的 符号 扩充 方法 


国 2.6 掌握 逻辑 运算 的 窍门 

解释 逻辑 右 移 时 ， 提 及 了 “逻辑 ”这 个 术语 。 大 家 听 到 逻辑 这 个 词 
可 能 会 感 党 有 些 难 ， 但 实际 上 它 很 简单 。 在 运算 中 ， 与 逻辑 相对 的 术 
语 是 算术 。 我 们 不 妨 这 样 考虑 ， 将 二 进 制 数 表示 的 信息 作为 四 则 运算 
的 数值 来 处 理 就 是 算术 。 而 像 图 形 模式 那样 ， 将 数值 处 理 为 单纯 的 0 
和 1 的 罗列 束 是 逻辑 。 

计算 机 能 处 理 的 运算 ， 大 体 可 分 为 算术 运算 和 你 辑 运 算 。 算 术 运 
算是 指 加 减 乘 除 四 则 运算 。 逻 辑 运算 是 指 对 二 进 制 数 各 数字 位 的 0 和 1 
分 别 进行 处 理 的 运算 ， 包 括 铝 加 有 07 了 运 划 加 和 NAND 辐 
算 ) 逻辑 或 ( OR 运算 ) 和 让 辑 异 或 ( XOR 运算 “) 四 种 。 


QQ XOR 是 英语 exclusive or 的 缩写 。 有 时 也 将 XOR 称 为 EOR。 
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逻辑 非 指 的 是 0 变 成 1、1 变 成 0 的 取 反 操作 。 逻 辑 与 指 的 是 “两 
个 都 是 1” 时， 运算 结 琳 为 1， 其 他 情况 下 运算 结 末 都 为 0 的 运 拭 。 逻 
辑 或 指 的 是 “至 少 有 一 方 是 1” 时 ， 运算 结 来 为 1， 其 他 情况 下 运算 结 
果 都 是 0 的 运算 。 逻 辑 异 或 指 的 是 排斥 相同 数值 的 运算 。 “两 个 数值 不 
同 ”， 也 就 是 说 ， 当 “其 中 一 方 是 1， 男 一 方 是 0” 时 运算 结果 是 1， 其 
他 情况 下 结果 都 是 0。 不 管 是 几 位 的 二 进 制 数 ， 在 进行 逻辑 运算 时 ， 虱 
是 对 相对 应 的 各 数位 分 别 进行 运算 。 


表 2-1 一 表 2-4 总 结 了 各 逻辑 运算 的 结果 。 这 些 表 称 为 真 值 表 。 如 
果 将 二 进 制 数 的 0 作为 假 ( false )、1 作为 真 (true ) 来 考虑 ， 逻 辑 运算 
也 可 以 被 认为 是 真 假 的 运算 。 真 和 真 的 AND 运算 结果 为 真 ， 实 际 上 也 
确实 如 此 。 因 为 如 末 两 方面 都 是 真 ， 答 案 就 是 真 。 


表 2-1 逻辑 非 (NOT ) 的 真 值 表 表 2-2 逻辑 与 ( AND ) 的 真 值 表 
A 的 值 NOT A 的 运算 结果 A 的 值 B 的 值 A AND B 的 运算 结果 
0 1 0 0 0 
1 0 0 1 0 
1 0 0 
1 1 1 
表 2-3 逻辑 或 ( OR ) 的 真 值 表 表 2-4 逻辑 异 或 ( XOR ) 的 真 值 表 
A 的 值 B 的 值 A OR B 的 运算 结果 A 的 值 ”B 的 值 A XOR B 的 运算 结果 
0 0 0 0 0 0 


0 1 1 四 1 1 
1 0 1 1 0 1 
1 1 1 1 1 0 


掌握 逻辑 运算 的 从 门 ， 束 是 要 据 弃 用 二 进 制 数 表示 数值 这 一 想法 。 
大 家 不 要 把 二 进 制 数 表示 的 值 当 作 是 数值 ， 而 应 该 把 它 看 作 是 图 形 或 
者 开关 上 的 ON/OFF (1 是 ON, 0 是 OFF )。 光 辑 运算 的 运算 对 象 不 是 
数值 ， 因 此 不 会 出 现 进 位 的 情况 。 看 起 来 好 像 有 些 麻 烦 ， 总 之 就 是 不 
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要 将 它 作 为 数值 来 考虑 。 为 外 ， 还 有 一 点 非 弟 重要 ， 就 是 要 对 各 种 他 
辑 运算 分 别 能 实现 什么 有 一 个 整体 印象 。 形 成 这 样 的 印象 后 ， 即 使 不 
看 真 值 表 也 能 判断 出 运算 的 绪 打 。 


图 2-12 表示 的 是 对 NIKKEI 的 头 两 个 字母 NI 这 一 网 形 模式 进行 各 
种 逻辑 运算 后 的 结 末 。 假 设 日 色 部 分 表示 1， 黑 色 部 分 表示 0。 通 过 图 
2-12， 我 们 就 会 对 逻辑 运算 有 一 个 具体 的 把 握 ， 即 “逻辑 非 是 所 有 位 的 
取 反 操作 ”逻辑 与 是 将 一 部 分 变 为 0 (复位 到 0 ) 的 操作 ”“ 逻 辑 或 是 
将 一 部 分 变 为 1( 复 位 到 1 ) 的 操作 ”“ 逻 辑 异 或 是 将 一 部 分 进行 取 反 
(相同 取 0, 不 同 取 1 ) 的 操作 ”。 


逻辑 非 运算 时 ， 全 部 取 反 
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学 完 本 曹 后 ， 大 家 应 该 对 二 进 制 数 、 移 位 运算 、 逻 辑 运 算 都 十 分 
了 解 了 吧 。 不过， 二 进 制 数 的 小 数 1011.0011 用 十 进 制 数 来 表示 的 话 是 
多 少 呢 ? 大 家 知道 吗 ? 想必 大 家 也 都 很 关心 如 何 用 二 进 制 数 来 表示 小 


数 这 一 问题 。 下 一 章 会 有 详细 说 明 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 @ 


如 果 是 你 ， 
你 会 怎样 介绍 ? 


回 小 学 生 讲 解 CPU 和 


下 面 ， 我 想 邀 请 正在 阅读 本 书 的 各 位 读者 来 进行 一 个 挑战 ， 那 就 是 向 完全 不 


了 解 程序 的 人 介 


二 进 制 


绍 程序 的 工作 原理 。 如 果 理 解 了 程序 的 本 质 ， 相 信 大 家 都 可 


以 用 通俗 易 懂 的 语言 进行 讲解 。 hk rene 


语 。 本 书 的 专栏 
试 。 亲爱 的 读者 们 ， 如 果 是 你 ， 
也 思考 一 下 吧 。 


笔者 : 大 家 见 过 电脑 吗 ? 

小 学 生 : 当然 了 ! 

笔者 : 在 哪里 见 过 呢 ? 

小 学 生 : 学 校 里 就 有 。 

笔者 : 大 家 通常 用 电脑 做 什么 呢 ? 
小 学 生 : 画图 或 者 上 网 。 

笔者 : 不 错 ! 看 来 大 家 经 常用 电脑 


呀 。 那 么 ， 大 家 知道 电脑 内 部 是 
怎么 构成 的 吗 ? 

小 学 生 ， 不 知道 a 

笔者 : 那 就 让 叔叔 来 告诉 你 们 吧 。 
来 ， 大 家 看 这 里 ! 


小 学 生 : 这 是 什么 呀 ? 
笔者 : 这 个 叫 作 CPU， 是 电脑 的 


是 笔者 同一 年 级 小 学 生 及 老奶奶 介 2 
你 会 怎 /CAN 样 个 纪 8 呢 ? 


如 程序 工作 原理 的 一 
ee 


零 部 件 。 正 因为 有 了 它 ， 大 家 才 
能 在 电脑 上 画图 和 上 了 网。 算术 计 
算 的 时 候 也 会 用 到 哦 。 电 脑 中 有 
很 多 部 件 ， 最 重要 的 就 是 这 个 
CPU。 

小 学 生 : 喷 ， 上 面 有 好 多 昆虫 一 样 
的 小 脚 ( 引 脚 ) 呢 。 

笔者 : 不 错 ， 挺 善于 观察 的 嘛 ! 这 
个 引 脚 会 有 电流 通过 。 
小 学 生 : 通电 后 会 怎 和 
光 吗 ? 

笔者 : CPU 不 会 发 光 。 但 是 ， 通 过 
电流 信和 号， 我 们 就 可 以 给 CPU 发 
送 指令 或 者 传递 数字 信息 等 。 比 


么 样 啊 ? 会 发 
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如 说 ， 让 电脑 计算 1+2 的 时 候 ， 
就 要 把 进行 加 法 计算 的 命令 和 1 
和 2 这 两 个 数字 传递 给 CPU。 
小 学 生 : 电流 是 怎么 把 指令 和 数字 
告诉 CPU 的 呢 ? 

笔者 : 不 错 不 错 ， 又 注意 到 一 个 有 
意思 的 地 方 。CPU 的 引 脚 有 电流 
通过 时 ， 数 值 为 1， 没有 电流 通过 
的 时 候 数 值 为 0， 这 是 CPU 里 的 
规定 。 咱 们 平时 使 用 的 是 0 一 9 
这 10 个 数字 ， 而 电脑 只 用 0 和 1 
这 两 个 数字 符号 。 怎 么 样 ， 是 不 
是 很 有 意思 呀 ? 

小 学 生 : 就 用 0 和 1， 不 会 不 够 
用 吗 ? 

笔者 : 不 会 啊 ! 咱们 来 数 数 看 。0、 
1、10、11、100、…、1010。 你 
看 ， 还 是 人 够 用 的 。 

小 学 生 : 1 的 下 一 个 是 10〈 一 零 )， 
这 好 奇怪 呀 ! 

笔者 :( 呵呵 呵 ， 马 上 就 要 讲 到 重 
点 了 ) 不 奇怪 啊 ! 这 就 是 二 进 制 
数 的 计数 方式 。 咱 们 用 0、1、2、 
3、…、9、10 这 样 的 顺序 来 计数 ， 
数 到 9 以 后 下 一 个 就 是 10， 这 就 
是 十 进 制 数 的 计数 方式 。 电 脑 使 
用 的 是 二 进 制 数 ， 用 0 和 1 来 计 


数 ， 所 以 0 和 1 的 下 一 个 数 就 是 
10 了 。 

小 学 生 : 啊 ， 不 太 明 白 呀 …… 
笔者 :( 啊 啊 ， 不 妙 啊 ……) 咱们 
换 一 种 方式 来 考虑 。 咀 们 还 是 用 
0 一 9 的 数字 来 计数 。 但 在 遥远 的 
宇宙 边缘 ， 生 活 看 只 用 数字 0 和 1 
的 外 星人 。 电 脑 就 跟 这 个 外 星人 
差不多 。 这 样 讲 大 家 明日 了 吧 ? 
小 学 生 : ? ? ? 

笔者 : 明日 了 7 吗 ? 

小 学 生 : 咽 ……… 

笔者 : 回答 得 这 么 不 干脆 啊 ? 
小 学 生 : 差不多 …… 明 白 了 吧 。 


3 


Wx 
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、 
AYA 8 \ = 一 一 
一 二 E= 
abd 一 一 


计算 灶 进行 洲 数 运算 时 


9 类 | 身 | 问答 


阅读 正文 前 ， 让 我 们 先 回答 下 面 的 问题 来 热 热身 吧 。 


1. 二 进 制 数 0.1， 用 十 进 制 数 表 示 的 话 是 多 少 ? 

2. 用 小 数 点 后 有 3 位 的 二 进 制 数 ， 能 表示 十 进 制 数 0.625 吗 ? 

3. 将 小 数 分 为 符号 、 尾 数 、 基 数 、 指 数 4 部 分 进行 表现 的 形式 
称 为 什么 ? 

4. 二 进 制 数 的 基数 是 多 少 ? 

5. 通过 把 0 作为 数值 范围 的 中 间 值 ， 从 而 在 不 使 用 符号 位 的 情 
况 下 来 表示 负数 的 表示 方法 称 为 什么 ? 

6. 10101100.01010011 这 个 二 进 制 数 ， 用 十 六 进 制 数 表 示 的 


话 是 多 少 ? 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 
是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


1. 0.5 
2. 能 表示 

3. 浮 点 数 ( 浮 点 数 形式 ) 
4. 2 

5. EXCESS 系统 表现 
6. AC.53 


1， 二 进 制 数 的 小 数 点 后 第 一 位 的 位 权 是 2 = 0.5。 也 就 是 说 ， 二 进 
制 数 0.1 一 1 x 0.5 一 十 进 制 数 0.5。 

2. 十 进 制 数 0.625 转换 成 二 进 制 数 是 0.101。 

3. 浮 点 数 是 指 把 小 数 用 “符号 尾数 x 基数 的 指数 次 需 ” 这 种 形式 
来 表示 。 

4. 二 进 制 数 的 基数 是 2， 十 进 制 数 的 基数 是 10。 以 此 类 推 ，x x 
进 制 数 的 基数 就 是 x x 。 

5$.， EXCESS 是 “剩余 的 ”的 意思 。 例 如 ， 把 01111111 看 作 是 0 的 
话 ， 比 这 个 数 小 1 的 01111110 就 是 -1。 

6， 整数 部 分 和 小 数 部 分 一 样 ， 二 进 制 数 的 4 位 ， 就 相当 于 十 六 进 
制 数 的 1 位。 
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大 家 可 能 会 认为 “万 能 的 计算 机 是 不 会 出 现 计 算 
谓 误 的 "。 但 实际 上 ， 依 然 存 在 程序 运行 后 无 法 得 到 正 
确 数值 的 情况 。 其 中 ， 小 数 运算 就 是 一 个 典型 的 例子 。 本 章 将 会 说 明 
计算 机 进行 小 数 处 理 的 机 制 。 这 也 是 所 有 程序 员 都 需要 掌握 的 基础 知 
识 之 一 。 掌 握 了 这 个 知识 ， 也 就 了 解 了 计算 机 在 运算 时 为 什么 会 出 错 ， 
以 及 应 该 如 何人 避免 出 错 。 这 个 问题 可 能 会 有 些 难 懂 ， 因 此 本 章 进行 了 
非常 详细 的 说 明 ， 也 请 大 家 仔细 阅读 。 


3.1 将 0.1 累加 100 次 也 得 不 到 10 

首先 ， 我们 来 看 一 个 计算 机 运算 错误 ( 无 法 得 到 正确 结果 ) 的 例 
子 。 代 码 清单 3-1 是 将 0.1 累加 100 次 ， 然 后 将 结果 输出 到 显示 器 上 的 
C 语言 程 序 。 


代码 清单 3-1 将 0.1 累加 100 次 的 C 语言 程序 


Hueco 


veng medim( 于 
float sum; 
Tm Ls 


// 将 保存 总 和 的 变量 清 0 


Sm 0 


ZA 加 O00 从 
for (LT = 1; 1<= L007 1++) | 
Sr 二 


} 


// 显示 结果 


elmeE (VEE\n, Sum) 7 
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自 完 把 0 赋值 给 变量 gw， 然后 在 此 基础 上 素 加 100 次 0.1。sum 
+ = 0.1; 表示 为 现在 的 sum 值 加 0.1。forG = 1; i<= 100; i 计 +){...} 表示 将 
人 } 内 包含 的 处 理 重复 100 次 。 最 后 ， 使 用 printf("%f\n", sum);， 将 累加 
100 次 0.1 后 的 变量 sum 的 值 输出 到 显示 器 上 。 


大 家 心算 一 下 就 能 知道 ，0.1 累加 100 次 后 的 结果 是 10。 但 是 ， 代 
人 码 清 单 3-1 的 程序 运行 后 ， 显 示 器 上 显示 的 结果 并 不 是 10 ( 图 3-1 )。 


C:\Yazawa\Samples>TestProgl. exe 和 
10. 000002 


图 3-1 代码 清单 3-1 的 运行 结果 不 是 10 


程序 没 错 计算 机 也 没有 发 生 故 障 ， 当 然 ，C 语言 也 没有 什么 问 
题 。 可 为 什么 会 出 现 这 样 的 结果 呢 ? 这 时 ， 如 果 考 虑 一 下 计算 机 处 理 
小 数 的 机 制 ， 就 讲 得 通 了 。 那 么 ， 计 算 机 内 部 是 如 何 处 理 小 数 的 呢 ? 


国 3.2 用 二 进 制 数 表示 小 数 

在 第 2 半 中 ， 我 们 对 整数 的 二 进 制 数 表 现 方 法 做 了 说 明 。 由 于 计 
算 机 内 部 所 有 的 信息 都 是 以 二 进 制 数 的 形式 来 处 理 的 ， 因 此 在 这 一 点 
上 ， 整数 和 小 数 并 无 差别 。 不 过 ， 使 用 二 进 制 数 来 表示 整数 和 小 数 的 
方法 却 有 很 大 的 不 同 。 


在 说 明 计算 机 如 何 用 二 进 制 数 表 示 小 数 的 具体 方法 前 ， 我 们 先 做 
个 热 号 ， 把 1011.0011 这 个 有 小 效 点 的 二 进 制 效 转换 成 十 进 制 数 。 小 数 
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点 前 面部 分 的 转换 方法 在 第 2 章 中 已 经 介绍 过 了 。 只 需 将 各 数位 数值 
和 位 权 “ 相 乘 ， 然 后 再 将 相 乘 的 结果 相 加 即 可 实现 。 那 么 ,小数点 后 面 
的 部 分 要 如 何 进行 转换 呢 ? 其 实 ， 它 的 处 理 和 整数 是 一 样 的 ， 将 各 数 
位 的 数值 和 位 权 相 乘 的 结果 相 加 即 可 ( 图 3-2 )。 


图 3-2 二 进 制 数 小 数 转换 成 十 进 制 数 的 方法 


二 进 制 数 小 数 点 前 面部 分 的 位 权 ,， 第 1 位 是 2 的 0 次 究 、 第 2 位 
是 2 的 1 次 寡 …… 以 此 类 推 。 坏 产 纳 怖 面 证人 的 加 俩 是 四 
全 EU 克 守 二 的 0 四 0 的 E7 砍 虹 以 此 类 推 。0 次 短 前 面 的 位 的 位 权 
按照 1 次 震 、2 次 震 …… 的 方式 递增 ，0 次 蜂 以 后 的 位 的 位 权 按 照 -1 
次 宕 、-2 次 宕 …… 的 方式 递减 。 芯 皇 规律 六 丰 仅 限于 寺 提交 天 站 辣 
对 制 数 和 下 渤 制 效 计 id 打 同 | 有 和 相生， 既然 二 进 制 数 的 小 数 点 后 第 3 位 
是 2 的 -3 次 寡 (0.125),， 第 4 位 是 2 的 -4 次 需 (0.0625 )， 那 么 小 数 点 
以 后 的 .0011 转换 成 十 进 制 数 就 应 该 是 0.125 + 0.0625 = 0.1875。 此 外 ， 
由 于 整数 部 分 的 1011 转换 成 十 进 制 数 是 11。 因 此 ， 二 进 制 数 
1011.0011 转换 成 十 进 制 数 就 是 11 + 0.1875 = 11.1875。 
(D 位 权 是 用 来 与 各 数字 位 的 数字 相 来 的 数值 ， 具 体 请 参照 第 2 章 。 
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3.3 ”计算 机 运算 出 铬 的 原因 

在 了 解 了 将 二 进 制 数 表示 的 小 数 转换 成 十 进 制 数 的 方法 后 ， 计 算 
机 运算 出 错 的 原因 也 就 容易 理解 了 。 这 里 我 先 把 答案 告诉 大 家 ， 计 算 
机 之 所 以 会 出 现 运 算 错 误 ， 是 因为 “ 饥 ， 些 于 进 制 数 的 本数 无 法 转换 成 
时 进 制 名 时 例如， 十 进 制 数 0.1， 就 无 法 用 二 进 制 数 正确 表示 ， 小 数 
太后 面 即使 有 几 百 位 也 无 法 表示 。 接 下 来 ,我 们 就 来 看 一 下 不 能 正确 
表示 的 原因 。 


图 3-2 中 ,小 数 点 后 4 位 用 二 进 制 数 表示 时 的 数值 范围 为 
0.0000 一 0.1111。 因 此 ， 这 里 只 能 表示 0.5、0.25、0.125、0.0625 这 四 个 
二 进 制 数 小 数 点 后 面 的 位 权 组 合 而 成 ( 相 加 总 和 ) 的 小 数 。 将 这 些 数值 
组 合 后 能 够 表示 的 数值 ， 即 为 表 3-1 中 所 示 的 无 序 的 十 进 制 数 。 


表 3-1 小 数 点 后 4 位 能 够 用 二 进 制 数 表示 的 数值 
二 进 制 数 是 连续 的 ， 十 进 制 数 是 非 连贯 芯 


二 进 制 数 对 应 的 十 进 制 数 
0.0000 0 
Qoo00l 90625 
Qo0010 Wo 
Qo0ll ors 
Www 625 
Qonol e225 
O01l10 9375 
Qo 0.4375 
Wwwuw W 
600 05625 
Ql010 Wu > 
Qo 65 
OUww 0%5 
Qnliol Ql2S 
le, Www 
Wi 下 权 Www 
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表 3-1 中 ， 十 进 制 数 0 的 下 一 位 是 0.0625。 因 此 ， 这 中 间 的 小 数 ， 
就 无 法 用 小 数 点 后 4 位 数 的 二 进 制 数 来 表示 。 同 样 ，0.0625 的 下 一 位 
数 一 下 子 变 成 了 0.125。 这 时 ， 如 果 增 加 二 进 制 数 小 数 点 后 面 的 位 
数 ， 与 其 相对 应 的 十 进 制 数 的 个 数 也 会 增加 ， 但 不 管 增加 多 少 位 ， 


2 的 -OO 次 老 怎 么 相 加 都 无 法 得 到 0.1 这 个 结果 。 实 际 上 ， 十 进 制 数 
0.1 转换 成 二 进 制 后 ， 会 变 成 0.00011001100… ( 1100 循环 ) 这 样 的 循 
环 小 数 。 这 和 无 法 用 十 进 制 数 来 表示 1/3 是 一 样 的 道理 。1/3 就 是 
0.3333…， 同 样 是 循环 小 数 。 


至 此 ， 大 家 应 该 明白 了 为 什么 用 代码 清单 3-1 的 程序 无 法 得 到 正确 
结果 了 吧 。 因 为 无 法 正确 表示 的 数值 ， 最 后 都 变 成 了 近似 值 。 计 算 机 
这 个 功能 有 限 的 机 器 设备 ， 是 无 法 处 理 无 限 循环 的 小 数 的 。 因 此 ,在 
遇 到 循环 小 数 时 ， 计 算 机 就 会 根据 变量 数据 类 型 所 对 应 的 长 度 将 数值 
从 中 间 截 断 或 者 四 售 五 人 。 我 们 知道 ， 将 0.3333… 这 样 的 循环 小 数 从 
中 间 截 断 会 变 成 0.333333， 这 时 它 的 3 倍 是 无 法 得 出 1 的 (结果 是 
0.999999 )， 计 算 机 运算 出 错 的 原因 也 是 同样 的 道理 。 


国 3.4 什么 是 浮 点 数 

像 1011.0011 这 样 审 小 数 点 的 表现 形式 ， 完 全 是 纸 面 上 的 二 进 制 数 
表现 形式 ， 在 计算 机 内 部 是 无 法 使 用 的 。 那 么 ,实际 上 计算 机 是 以 什 
么 样 的 表现 形式 来 处 理 小 数 的 呢 ? 我 们 一 起 来 看 一 下 。 

很 多 编程 语言 中 都 提供 了 两 种 表示 小 数 的 数据 类 型 ， 分 别 是 双 精 


度 浮 点 数 和 单 精度 浮 点 数 。 区 精度 浮 起 要 类 型 用 网 仙 和 单 精 度 浮 直观 


Q) 像 0.3333… 这 样 相同 数值 无 限 循环 的 值 称 为 循环 小 数 。 计 算 机 是 功能 有 限 
的 机 器 ， 无 法 直接 处 理 循环 小 数 。 
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蔷 到 月 52 网 ” 在 C 语言 中 , 双 精 度 浮 点 数 类 型 和 单 精 
度 浮 点 数 类 型 分 别 用 double 和 float 来 表示 。 不 过 ， 这 些 数 据 类 型 都 采 
用 浮 点 数 “ 来 表示 小 数 。 那 么 ， 浮 点 数 究竟 采用 怎样 的 方式 来 表示 小 数 
呢 ? 接 下 来 就 让 我 们 一 起 来 看 一 下 


浮 点 数 是 指 用 符号 、 尾 数 、 基 数 和 指数 这 四 部 分 来 表示 的 小 数 (图 
3-3 )。 因 为 计算 机 内 部 使 用 的 是 二 进 制 数 ， 所 以 基数 自然 就 是 2。 因 


此 ， 实 际 的 数据 中 往往 不 考虑 基数 ， 只 用 符号 、 尾 数 、 指 数 这 三 部 分 
即 可 表示 浮 点 数 。 也 就 是 说 ，64 位 ( 双 精 度 浮 点 数 ) 和 32 位 ( 单 精 度 
浮 点 数 ) 的 数据 ， 会 被 分 为 三 部 分 来 使 用 (图 3-4 )。 


a 风 


/| 


符号 尾数 ”基数 指数 


ii 双 精 度 浮 点 数 能 够 表 加 的 正 数 范 围 是 4.94065645841247x10” 
1.79769313486232x10”“， 负 数 范 围 是 -1.79769313486232 x 10” 
一 4.94065645841247x10 “。 单 精度 浮 点 数 能 够 表示 的 正 数 范围 是 
1.401298x10 “一 3.402823 x 10 ， 负 数 范 3.402823 x 10 ~ -1.401298x10 。 
不 过 ， 正 如 正文 中 所 介绍 的 那样 ， 在 这 些 范 围 中 ， 有 些 数值 是 无 法 正确 表 
人 的 5 

@ 像 0.12345x10 和 0.12345x10 这 样 使 用 与 实际 小 数 点 位 置 不 同 的 书写 方法 
来 表示 小 数 的 形式 称 为 浮 点 数 。 与 浮 点 数 相对 的 是 定点 数 ， 使 用 定点 数 表示 
小 数 时 ， 小 数 点 的 实际 位 置 国定 不 变 。 例 如 ，0.12345x 10 和 0.12345 x 10 用 
定点 数 来 表示 的 话 即 为 123.45 和 0.012345。 
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@@ 双 精 度 浮 点 数 ( 共 64 位 ) 
Ff J 


符号 部 分 ”指数 部 分 


会 单 精 度 浮 点 数 ( 共 32 位 ) 
De 3 


符号 部 分 指数 部 分 


WE a abi As 


浮 点 数 的 表现 方式 有 很 多 种 ， 这 里 我 们 使 用 最 为 普遍 的 IEEE 标 
准 。 双 精度 浮 点 数 和 单 精度 浮 点 数 在 表示 同一 个 数值 时 使 用 的 位 数 不 
同 。 此 外 ， 双 精度 浮 点 数 能 够 表示 的 数值 范围 要 大 于 单 精度 浮 点 数 。 


符号 部 分 是 指使 用 一 个 数据 位 来 表示 数值 的 特写。 该 数据 位 是 1 
时 表示 负 ， 为 0 时 则 表示 “ 正 或 者 0"。 这 和 用 二 进 制 数 来 表示 整数 时 
的 符号 位 是 同样 的 。 数 值 的 大 小 用 尾数 部 分 和 指数 部 分 来 表示 。 例 如 ， 
小 数 就 是 用 “尾数 部 分 x 2 的 指数 部 分 次 医 ” 这样 的 形式 来 表示 的 。 讲 
到 这 里 ， 大 家 旦 不 是 多 少 有 操 概念 了 呢 。 


下 面 的 内 容 可 能 稍微 有 点 复杂 ， 因 为 尾数 部 分 和 指数 部 分 并 不 只 
是 单单 存储 肴 用 整数 表示 的 二 进 制 数 。 尾 数 部 分 用 的 是 “将 小 数 点 前 面 
的 值 固定 为 1 的 正则 表达 式 ”， 而 指数 部 分 用 的 则 是 “EXCESS 系统 表 
现 ”"。 此 外 ， 接 下 来 还 会 涉及 大 量 的 新 术语 ， 大 家 可 能 会 因此 产生 逃避 
心理 。 不 过 ,这 些 其 实 并 不 难 ， 因 此 请 大 家 一 定 要 耐心 地 阅读 下 去 。 


(D IEEE (Institute of Electrical and Electronics Engineers ) 是 指 美 国电 气 和 电子 
工程 师 协 会 。 该 协会 制定 了 计算 机 领域 的 各 种 规定 。 读 作 “eye-triple-e，I-3E”。 
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哮 3.5 正则 表达 式 和 EXCESS 系统 

尾数 部 分 使 用 正则 表达 式 ， 可 以 将 表现 形式 多 样 的 浮 点 数 统一 为 
一 种 表现 形式 。 例 如 ， 十 进 制 数 0.75 就 有 很 多 种 表现 形式 ， 如 图 3-5 
所 示 。 虽 然 它们 表示 的 都 是 同一 个 数值 ， 但 因为 表现 方法 太 多 ,计算 
机 在 处 理 时 会 比较 麻烦 。 因 此 ， 为 了 方便 计算 机 处 理 ， 需 要 制定 一 个 
统一 的 规则 。 例 如 ， 十 进 制 数 的 浮 点 数 应 该 遵循 “小 数 点 前 面 是 0， 小 
数 点 后 面 第 1 位 不 能 是 0” 这 样 的 规则 。 根 据 这 个 规则 ，0.75 就 是 
“0.75 x10 的 0 次 需 "， 也 就 是 说 ， 只 能 用 尾数 部 分 是 0.75、 指 数 部 分 
是 0 这 个 方法 来 表示 。 根 据 这 个 规则 来 表示 小 数 的 方式 ， 就 是 正则 表 
达 式 。 


O75 =075 x lO 


O75 T7110 


075=0075x10 


图 3-5 浮 点 数 可 以 用 不 同 的 形式 来 表现 同一 个 数值 


刚才 以 十 进 制 数 为 例 进 行 了 说 明 ， 二 进 制 数 也 是 同样 的 道理 。 在 

二 进 制 数 中 ， 我 们 使 用 的 是 “将 小 数 点 前 面 的 值 固 定 为 1 的 正则 表达 

式 "。 具 体 来 讲 ， 就 是 将 二 进 制 数 表示 的 小 数 左 移 或 右 移 ( 这 里 是 逻辑 

移 位 。 因 为 符号 位 是 独立 的 ) 数 次 后 ， 整 数 部 分 的 第 1 位 变 为 1, 第 2 

DD 按照 特定 的 规则 来 表示 数据 的 形式 即 为 正则 表达 式 。 除 小 数 之 外 ， 字 符 事 
以 及 数据 库 等 ， 也 都 有 各 自 的 正则 表达 式 。 


( 整数 是 指使 用 包含 表示 符号 的 最 高 位 在 内 的 全 体 来 表示 的 一 个 数值 而 浮 
点 数 是 由 符号 部 分 、 尾 数 部 分 和 指数 部 分 这 三 部 分 独立 的 数值 组 合 而 成 的 。 
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位 之 后 都 变 为 0 ( 这样 是 为 了 消除 第 2 位 以 上 的 数位 )。 而 且 ， 第 1 位 的 
1 在 实际 的 数据 中 不 保存 。 由 于 第 1 位 必须 是 1， 因此 ， 省 略 该 部 分 后 就 
记 省 了 一 个 数据 位 ， 从 而 也 就 可 以 表示 更 多 的 数据 范围 〈 虽 不 算 太 多 


单 精度 浮 点 数 的 正则 表达 式 的 具体 例子 如 图 3-6 所 示 。 单 精 度 浮 
点 数 中 ， 尾 数 部 分 是 23 位 ， 但 由 于 第 1 位 的 1 被 省 略 了 ， 所 以 实际 上 
可 以 表示 24 位 的 数值 。 双 精度 浮 点 数 的 表示 方法 也 是 如 此 ， 只 是 位 数 
不 同 而 已 。 


IE ox 人 利 


UUUluiTou … 右 移 使 整数 部 分 的 第 1 位 变 成 1 


0001.01100110000000000000000 … 确保 小 数 点 以 后 的 长 度 为 23 位 


01100110000000000000000 … 仅 保 留 小 数 点 后 面 的 部 分 ， 完 成 正则 表达 陈 


图 3-6 单 精度 浮 点 数 尾数 部 分 的 正则 表达 式 


接 下 来 ， 让 我 们 一 起 来 看 一 下 指数 部 分 中 使 用 的 EXCESS 系统 ， 
使 用 这 种 方法 主要 是 为 了 表示 负数 时 不 使 用 符号 位 。 在 某 些 情况 下 ， 
在 指数 部 分 ， 需 要 通过 “人 负 OO 〇 次 究 ” 的 形式 来 表示 人 负数。EXCESS 
系统 表现 是 指 ， 通 过 将 指数 部 分 表示 范围 的 中 间 值 设 为 0， 使 得 负数 不 
需要 用 符号 来 表示 。 也 就 是 说 ， 当 指数 部 分 是 8 位 单 精 度 浮 点 数 时 ， 
最 大 值 11111111 = 255 的 /2， 即 01111111 = 127 ( 小 数 部 分 舍弃 ) 表示 
的 是 0， 指 数 部 分 是 11 位 双 精 度 浮 点 数 时 ，11111111111 = 2047 的 1/2， 
即 01111111111 = 1023 (小数 部 分 舍弃 ) 表示 的 是 0。 


EXCESS 系统 可 能 不 太 好 理解 ， 下 面 举例 来 说 明 。 假 设 有 这 样 一 
个 游戏 , 用 1 一 13 (A~ 开 ) 的 扑克 牌 来 表示 负数 。 这 时 ， 我 们 可 以 把 
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中 间 的 7 这 张 牌 当 成 0。 如 采 扑 殉 牌 7 是 0，10 束 表 示 +3，3 束 表 
未 -4。 事 实 上 ， 这 个 规则 说 的 就 是 EXCESS 系统 。 


作为 单 精 度 浮 点 数 的 示例 ， 表 3-2 中 列 出 了 指数 部 分 的 实际 值 和 用 
EXCESS 系统 表现 后 的 值 。 例 如 ， 指 数 部 分 为 二 进 制 数 11111111 (十 
进 制 数 255 )， 那 么 在 EXCESS 系统 中 则 表示 为 128 次 震 。 这 是 因为 
255-127 = 128。 因 此 , 8 位 的 情况 下 ， 表 示 的 范围 就 是 -127 次 
寡 一 128 次 寡 。 


表 3-2 单 精 度 浮 点 数 指数 部 分 的 EXCESS 系统 表现 
实际 的 值 ( 二 进 制 数 ) 实际 的 值 ( 十 进 制 数 ) ”EXCESS 系统 表现 ( 十 进 制 数 ) 


Te 255 128"( = 255 127) 
11111110 254 人 
加 12% 人 

0 126 1 | 间 
00000001 1 -126 (= 1- 127) 
00000000 0 ~- 127 (= 0- 127) 


3.6 ”在 实际 的 程序 中 进行 确认 
读 到 这 里 ， 有 人 额 角 冒 汗 吗 ? 上 述 内 容 不 是 仅仅 读 一 遍 就 能 马上 
理解 的 ， 最 好 能 够 在 实际 的 程序 中 加 以 确认 。 因 此 ， 我 们 准备 了 一 个 
试验 用 的 程序 ， 如 代码 清单 3-2 所 示 。 接 下 来 ， 就 让 我 们 一 起 看 一 下 如 
何 用 单 精度 浮 点 数 来 表示 十 进 制 数 0.75 吧 。 


代码 清单 32 用 于 确认 单 精 度 浮 点 数 表示 方法 的 C 语言 程序 


全 LU 人 SCLO , hs 


le lliel eS 


void main() { 
EL SaiE GEa7 
unsigned long buff,; 
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1imte is 
cna ie 


// 将 0.75 以 单 精度 浮 点 数 的 形式 存储 在 变量 aate 中 。 
Gesies 二 人 IST os 


// 把 数据 复制 到 4 字 节 长 度 的 整数 变量 puff 中 以 逐个 提取 出 每 一 位 。 
memcpy (&buff, &data, 4); 


77 这 一 避 取 出 鲜 信 


For (133 7S 0 1 = 
1 (i == 1 | = LO0) 
// 加 入 破 折 号 来 区 分 符号 部 分 、 指 数 部 分 和 尾数 部 分 。 
Sl = 
} else { 
// 为 各 个 字 节 赋值 '0' 或 者 '11'。 
| 
SI] 
} else { 
古语 本 三 
} 
lon /ss 多 7 
| 
Ss[34] = '\0's 


// 显示 结果 。 


DlmEE (VSS\nr, ); 


该 程序 执行 后 ， 十 进 制 数 0.75 用 单 精度 浮 点 数 来 表示 就 变 成 了 
0-01111110-10000000000000000000000 (图 3-7 )。 加 入 破 折 号 (- ) 是 为 
了 区 分 符号 部 分 、 指 数 部 分 、 尾 数 部 分 。 这 里 ， 和 从 号 部 分 为 0， 指数 部 
分 为 01111110， 尾 数 部 分 为 10000000000000000000000。 因 为 0.75 是 
正 数 ， 所 以 符号 位 是 0。 指 数 部 分 的 01111110 是 十 进 制 数 126， 用 
EXCESS 系统 表现 就 是 -1 (126-127 = -1)。 根 据 正则 表达 式 的 规则 ， 
小 数 点 前 面 的 第 1 位 是 1， 因 此 尾数 部 分 10000000000000000000000 实 
际 上 表示 的 是 1.10000000000000000000000 这 个 二 进 制 数 。 将 尾数 部 分 
的 二 进 制 数 转 换 成 十 进 制 数 ， 结 果 就 是 (1 x2 的 0 次 震 ) +(1x2 的 -1 
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次 宕 ) = 1.5。 因 此 ，0-01111110-10000000000000000000000 这 个 单 精度 
浮 点 数 ， 表 示 的 就 是 “+1.5 x 2 的 -1 次 究 ”。2 的 -1 次 窜 是 0.5, +1.5 
x 0.5 = 十 0.75。 正 好 吻合 ， 结 果 正 确 。 


awa\Samples>TestProg2. exe 
1110-10000000000000000000000 


”图 3-7 代码 清单 3-2 的 运行 结果 


接 下 来 ,我们 继续 使 用 该 程序 来 看 一 下 如 何 用 单 精度 浮 点 数 表示 十 进 
制 数 0.1。 运 行 后 就 会 发 现 结果 为 0-01111011-10011001100110011001101 
(只 需 将 data = (float)0.75; 的 部 分 变 成 data = (float)0.1; 即 可 )。 这 时 ， 
如 果 反 过 来 计算 一 下 这 个 数值 的 十 进 制 数 ， 估 计 大 家 又 要 冒 汗 了 ， 绪 
果 居 然 不 是 0.1。 


旨 数 部 分 … 转 换 成 十 进 制 数 后 是 126。 
在 EXCESS 系 下 ， 表 示 的 是 126 - 127 = -1 的 意思 


一 一 人 一 一 
0 一 01111110 一 10000000000000000000000 
于 === 
尾数 部 分 … 表 示 的 是 1. 以 后 的 部 分 ， 
也 就 是 1.10000000000000000000000 


访 交 如 用 刁 进 制 履 表示 为 11X2 用 填 进 市 政 表 示 为 15X2 =075 


.图 3.8_ 用 单 本 度 译 点数 表 示 的 数 
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邮 


国 3.7 如 何 避 免 计 算 机 计算 出 错 

计算 机 计算 出 错 的 原因 之 一 是 ， 采 用 浮 点 数 来 处 理 小 数 ( 另 外, 也 
有 因 “ 位 溢出 ”而 造成 计算 错误 的 情况 ) 作为 程序 的 数据 类 型 ， 不 管 
是 使 用 单 精 度 浮 点 数 还 是 双 精 度 序 点 数 ， 都 存在 计算 出 错 的 可 能 性 。 
接 下 来 将 介绍 两 种 避免 该 问题 的 方法 。 


首先 是 回避 策略 ， 即 无 视 这 些 错误 。 根 据 程序 目的 的 不 同 ， 有 时 
一 些微 小 的 偏差 并 不 会 造成 什么 问题 。 例 如 ， 假 设 使 用 计算 机 设计 工 
业 制 品 。 将 100 个 长 0.1 毫米 的 零件 连接 起 来 后 ， 其 长 度 并 非 一 定 要 是 
10 至 米 ，10.000002 训 米 也 没有 任何 问题 。 一 般 来 讲 ， 在 科学 技术 计算 
领域 , 计算 机 的 计算 结果 只 要 能 得 到 近似 值 就 是 够 了 。 那 些微 小 的 误 
差 完 全 可 以 忽略 掉 。 


另 一 个 策略 是 把 小 数 转换 成 整数 来 计算 。 计 算 机 在 进行 小 数 计 算 
时 可 能 会 出 错 ， 但 进行 整数 计算 ( 只 要 不 超过 可 人 处理 的 数值 范围 ) 时 一 
定 不 会 出 现 问题 。 因 此 ， 进 行 小 数 的 计算 时 可 以 暂时 使 用 整数 ， 然 后 
再 把 计算 结果 用 小 数 表示 出 来 即 可 。 例 如 ， 本 章 一 开头 讲 过 的 将 0.1 相 
加 100 次 这 一 计算 ， 就 可 以 转换 为 将 0.1 扩大 10 倍 后 再 将 1 相 加 100 
次 的 计算 ， 最 后 把 结果 除 以 10 就 可 以 了 (代码 清单 3-3 )。 


代码 清单 3.3 ”将 小 数 蔡 换 成 整数 来 计算 的 C 语言 程序 


#include <stdio.h> 


void main() { 
//int 是 整数 的 数据 类 型 
int sum; 
十 这 记 Lp 


// 将 保存 总 和 的 变量 清 0 


Sm 三 有 人 六 
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// 将 1 相 加 100 次 
for (i = 1; i <= 100; i++) { 


sum += 工 ; 


) 
// 总 和 结果 除 以 10 


sum /= 10; 


// 显示 结果 


Beilmes (Veo\n", SO) 7 


除 此 之 外 ，BCD ( Binary Coded Decimal ) 也 是 一 种 使 用 二 进 制 表 
示 十 进 制 的 方法 。 简 单 来 讲 ，BCD 就 是 用 4 位 来 表示 0~9 的 1 位 数字 
的 处 理 方法 ， 这 里 不 再 做 详细 说 明 。 在 涉及 财务 计算 等 不 允许 出 现 误 
差 的 情况 下 ， 一 定 要 将 小 数 转 换 成 整数 或 者 采 用 BCD 方法 ， 以 确保 最 
终 得 到 准确 的 数值 。 


二 进 制 数 和 十 六 进 制 数 


瞬 麻 烦 ， 因此 ， 在 实际 程序 中 ， 也 经 常会 用 十 六 进 制 数 来 代替 二 进 制 


数 。 在 C 语言 程序 中 , 伟 需 在 多 什 的 江 SSJEORUNO 和 允 ) 遍 国友 表 动 
十 六 进 制 数 。 


二 进 制 数 的 4 位 ， 正 好 相当 于 十 六 进 制 数 的 1 位 。 例 如 ，32 位 二 


进 制 数 00111101110011001100110011001101 用 十 六 进 制 数 来 表示 的 话 ， 


计算 机 中 用 到 的 数据 表现 形式 中 ， 有 一 种 叫 作 BCD (Binary Coded 
Decimal， 二 进 制 化 十 进 制 数 ) 的 方法 。 这 种 方法 常 被 用 于 老式 的 大 型 计算 
机 中 。 编 程 语 言 中 ，COBOL 也 会 使 用 BCD。BCD 分 为 Zone 十 进 制 数 形 
式 和 Pack 十 进 制 数 形式 两 种 。 
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就 是 3DCCCCCD 这 个 8 位 数 。 由 此 可 见 ， 通 过 使 用 十 六 进 制 数 ， 二 进 
制 数 的 位 数 能 够 缩短 至 原来 的 1/4。 位 数 变 少 之 后 ， 看 起 来 也 就 更 清晰 
了 (图 3-9)。 


二 进 制 数 ( 32 位 ) 十 六 进 制 数 ( 8 位 ) 
QO NiolmlITioo lnNo0 io TIO OO ilOl=SDECECEED 
ee 0 症 汪 交 让 皇 乓 站 下 下 | 瑟 汪 下 | 


图 3-9 通过 使 用 十 六 进 制 数 使 位 数 变 短 


用 十 六 进 制 数 来 表示 二 进 制 小 数 时 ， 小 数 点 后 的 二 进 制 数 的 4 位 
也 同样 相当 于 十 六 进 制 数 的 1 位。 不够 4 位 时 用 0 填补 二 进 制 数 的 低 
位 即 可 。 例 如 ，1011.011 的 低位 补 0 后 为 1011.0110， 这 时 就 可 以 表示 
为 十 六 进 制 数 B.6 ( 图 3-10 )。 铺 基 于 制 灼 的 由 类 三 盾 欧 辣 人 的 机 权 二 


俩 即 116 = 0.0625， 这 个 大 家 应 该 能 理解 吧 。 


二 进 制 数 ( 小 数 点 后 面 有 3 位 ) ”二 进 制 数 ( 最 低位 补 0 ) 十 六 进 制 数 
Wom ol 一 一 1011.0110 一 一 一 B.6 


图 3-10 ”小数 点 后 的 二 进 制 数 的 4 位 也 相当 于 十 六 进 制 数 的 1 位 


通过 学 习 第 2 章 和 本 章 的 内 容 ， 想 必 大 家 已 经 掌握 了 计算 机 通过 
二 进 制 数 来 处 理 数据 ( 数值 ) 的 机 制 。 接 下 来 的 一 章 ， 我 们 将 继续 向 大 
家 介绍 用 于 数据 存储 的 内 存 。 如 果 大 家 在 编程 时 能 够 时 刻 考虑 到 内 存 
问题 ， 那 么 就 一 定 能 彻底 理解 被 公认 为 复杂 难 懂 的 C 语言 的 数组 和 指 
针 了 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 S 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


二 | 在 人 - 一 全 
2 史上 作家 册 可 汉字 


9 抽身 | 问答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


1. 有 十 个 地 址 信号 引 脚 的 内 存 IC ( 集成 电路 ) 可 以 指定 的 地 址 
泄 围 是 多 少 ? 

. 高 级 编程 语言 中 的 数据 类 型 表示 的 是 什么 ? 

. 在 32 位 内 存 地 址 的 环境 中 ， 指 针 变 量 的 长 度 是 多 少 位 ? 

. 与 物理 内 存 有 着 相同 构造 的 数组 的 数据 类 型 长 度 是 多 少 ? 

. 用 LIFO 方式 进行 数据 读 写 的 数据 结构 称 为 什么 ? 

. 根据 数据 的 大 小 链表 分 叉 成 两 个 方向 的 数据 结构 称 为 什么 ? 


OO) Ol 上 记 
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么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


1. 


D a 和 上 mm 


用 二 进 制 数 来 表示 的 话 是 0000000000 ~ 1111111111 (用 
十 进 制 数 来 表示 的 话 是 0 ~ 1023 ) 


. 占据 内 存 区 域 的 大 小 和 存储 在 该 内 存 区 域 的 数据 类 型 
. 32 位 

1 字 节 

栈 
. 二 又 查 找 树 ( binary search tree ) 


.地 址 信号 引 脚 是 十 个 时 表示 2 = 1024 个 地 址 。 
.例如 ，C 语言 数据 类 型 中 的 short 类 型 ， 它 表示 的 就 是 占据 2 字 


廊 的 内 存 区域 ， 并 且 存 储 整数 。 
站 针 指 的 是 用 于 存储 内 存 地 址 的 变量 。 


. 物理 内 存 是 以 字 市 为 单位 进行 数据 存储 的 。 
. 栈 是 一 种 后 人 先 出 ( LIFO = Last In First Out ) 式 的 数据 结构 。 
.二 义 查 找 树 指 的 是 从 节点 分 成 两 个 又 的 树 状 数据 结构 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


计算 机 是 进行 数据 处 理 的 设备 ， 而 程序 表示 的 就 
是 处 理 顺 序 和 数据 结构 。 由 于 处 理 对 象 数据 是 存储 在 
内 存 和 磁盘 上 的 ， 因 此 程序 必须 能 自由 地 使 用 内 存 和 磁盘 。 因 此 ， 大 
家 有 必要 对 内 存 和 磁盘 的 构造 有 一 个 物理 上 的 ( 硬件 的 ) 和 逻辑 上 的 
( 软件 的 ) 认识 。 


本 章 的 主题 是 内 存 ( 磁盘 部 分 会 在 第 5 章 中 讲解 )。 其 实 ， 从 物理 
上 来 看 ， 内 存 的 构造 非 音 简单。 只 要 在 程序 上 人 花 一 些 心思 ， 就 可 以 将 
内 存 变 换 成 各 种 各 样 的 数据 结构 来 使 用 。 譬如 ,物理 上 有 校 有 角 的 内 存 ， 
在 程序 上 是 可 以 按照 逻辑 很 流畅 地 使 用 的 。 而 且 这 并 不 特别 ， 它 是 很 
多 程序 中 都 会 用 到 的 一 般 方 法 。 


4.1 内 存 的 物理 机 制 很 简单 

为 了 能 够 对 内 存 有 一 个 整体 把 握 ， 首 先 让 我 们 来 看 一 下 内 存 的 物 
理 机 制 。 吨 栓 英 吕 上 国 是 夺 种 儿 芍 六 和 NO 的 和 虽然 内 存 IC 包 
括 DRAM、SRAM、ROM 等 多 种 形式 , 但 从 外 部 来 看 ， 其 基本 机 制 者 
是 一 样 的 。 内 存 IC 中 有 电源 、 地 址 信和 号、 数据 信号 、 控 制 信号 等 用 于 
输入 输出 的 大 量 引 脚 (IC 的 引 脚 )， 通 过 为 其 指定 地 址 (address )， 来 
进行 数据 的 读 写 。 


图 4-1 是 内 存 IC (在 这 里 假设 它 为 RAM ) 的 引 脚 配置 示例 。 虽 然 
这 是 一 个 虚拟 的 内 存 IC， 但 它 的 引 脚 和 实际 的 内 存 IC 是 一 样 的 。VCC 


QU) ROM (Read Only Memory ) 是 一 种 只 能 用 来 读 取 的 内 存 。 

( RAM (Random Access Memory ) 是 可 被 读 取 和 写 入 的 内 存 ， 分 为 需要 经 常 
刷新 ( refresh ) 以 保存 数据 的 DRAM (Dynamic RAM )， 以 及 不 需要 刷新 电 
路 即 能 保存 数据 的 SRAM (StaticRAM )。 
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和 GND 是 电源 ，A0 一 A9 是 地 址 信号 的 引 脚 ，D0~D7 是 数据 信号 的 
引 脚 ，RD 和 WR 是 控制 信号 的 引 脚 。 将 电源 连接 到 VCC 和 GND 后 ， 
就 可 以 给 其 他 引 脚 传递 比如 0 或 者 1 这 样 的 信号 。 大 多 数 情 况 下 ，+5V 
的 直流 电压 表示 1，0V 表示 0。 


VCC A0 Al A2 A3 A4 Ap A6 AI AU A9 


RDYEWNR DONDN D2 4 D0/ GND 


VCC、GND， 电源 
A0~A9 ”:; 地 址 信号 
: 数据 信号 


: 控制 信号 


4-1 内 存 1C 的 引 脚 配置 示例 


那么 ， 这 个 内 存 IC 中 能 存储 多 少数 据 呢 ? 数据 信号 引 脚 有 D0~D7 
共 八 个 ， 表示 一 次 可 以 输入 输出 8 位 (= 1 字 节 ) 的 数据 。 此 外 ， 地 址 信 
号 引 脚 有 A0~A9 共 十 个 ， 表 示 可 以 指定 0000000000~1111111111 共 
1024 个 地 址 。 而 地 址 用 来 表示 数据 的 存储 场所 ， 因 此 我 们 可 以 得 出 这 
个 内 存 IC 中 可 以 存储 1024 个 1 字 节 的 数据 。 因 为 1024 = 1K ， 所 以 该 
内 存 IC 的 容量 就 是 IKB。 


现在 大 家 使 用 的 计算 机 至 少 有 512M 的 内 存 。 这 就 相当 于 512000 


Q) 在 计算 机 领域 ， 大写 字母 KK 表示 的 并 不 是 1000, 而 是 2 的 10 次 寞 的 结果 
1024。1000 通常 用 小 写 K 来 表示 。 
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个 (512MB : 1KB = 512K ) 1KB 的 内 存 IC。 当 然 ， 一 台 计 算 机 中 不 太 
可 能 放 入 如 此 多 的 内 存 IC。 通 常情 况 下 ， 计 算 机 使 用 的 内 存 IC 中 会 有 
更 多 的 地 址 信号 引 脚 ， 这 样 就 能 在 一 个 内 存 IC 中 存储 数 十 兆 字 节 的 数 
据 。 因 此 ， 只 用 数 个 内 存 IC， 就 可 以 达到 512MB 的 容量 。 


下 面 让 我 们 继续 来 看 刚才 所 说 的 1KB 的 内 存 IC。 首 先 ， 我 们 假设 
要 往 该 内 存 IC 中 写 入 1 字 节 的 数据 。 为 了 实现 该 目的 ， 可 以 给 VCC 
接 入 + 5V， 给 GND 接 入 0V 的 电源 ， 并 使 用 A0~A9 的 地 址 信号 来 
指定 数据 的 存储 场所 ， 然 后 再 把 数据 的 值 输入 给 D0~~D7 的 数据 信号 ， 
并 把 WR (write = 写 人 的 简写 ) 信号 设 定 成 1。 执 行 完 这 些 操 作 ， 就 可 
以 在 内 存 IC 内 部 写 入 数据 (图 4-2 (a) ) 了 。 


读 出 数据 时 ， 只 需 通 过 A0~A9 的 地 址 信号 指定 数据 的 存储 场所 ， 
然后 再 将 RD (read = 读 出 的 简写 ) 信号 设 成 1 即 可 。 执 行 完 这 些 操 
作 ， 指 定 地 址 中 存储 的 数据 就 会 被 输出 到 D0~D7 的 数据 信号 引 脚 
(图 4-2(b) ) 中 。 另 外 ， 像 WR 和 RD 这样 可 以 让 IC 运行 的 信号 称 
为 控制 信号 。 其 中 ， 当 WR 和 了 RD 同时 为 0 时 ， 写 人 和 读 出 的 操作 都 
无 闫 进行 。 

由 此 可 见 ， 内 存 IC 的 物理 机 制 实质 上 是 很 简单 的 。 总 体 来 讲 ， 内 
存 IC 内 部 有 大 量 可 以 存储 8 位 数据 的 地 方 ， 通 过 地 址 指定 这 些 场所 ， 
之 后 即 可 进行 数据 的 读 写 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 全 


(ay 0101010101 地 二 写 入 11110000 效 后 时 


VCC A0 Al A2 A3 A4 A5 A6 AI A8 A9 


+ 5V 1 ) 指定 地 址 


O_O 0V__[(2) 输入 数据 
吕 国 证 WAV EXO DI DD As DeND 


(b ) 读 出 0101010101 地 址 的 数据 时 


Neo TRAIN /A596 2 0 
+5V1| 0 1 0 1 0 1 0 1 0 1 ( 1 ) 指定 地 址 


REBTWREEDOPPDI D2 "D049 D3 Do D7 GND 


4-2 向 内 存 1C 中 写 入 和 读 出 数据 的 方法 
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团 4.2 内 存 的 逻辑 模型 是 楼 房 

在 介绍 程序 时 ， 大 部 分 参考 书 都 会 用 类 似 于 楼 房 的 图 形 来 表示 内 
存 。 在 这 个 楼 房 中 ，1 层 可 以 存储 1 个 字 节 的 数据 ， 楼 层 号 表示 的 就 是 
地 址 。 对 于 程序 员 来 说 ， 这 种 形象 的 解说 有 助 于 了 解 内 存 。 


虽然 内 存 的 实体 是 内 存 IC， 不 过 从 程序 员 的 角度 来 看 ， 也 可 以 把 
它 假想 成 每 层 部 存储 着 数据 的 楼 房 ， 并 不 需要 过 多 地 关注 内 存 IC 的 电 
源 和 控制 信号 每 。 因 此， 之 后 的 讲解 中 我 们 也 同样 会 使 用 楼 房 图 ( 或 者 
与 楼 房 相似 的 图 )。 内 存 为 IKB 时 ， 表 示 的 是 如 图 4-3 所 示 的 有 1024 
层 的 楼 房 ( 这 里 地 址 的 值 是 从 上 往 下 逐渐 变 大 ， 不 过 也 有 与 此 相反 的 
情况 )。 


地 址 内 存 的 内 容 

0000000000 1 字 节 的 数据 

0000000001 1 字 节 的 数据 

0000000010 1 字 节 的 数据 1024 层 楼 房 中 ， 
; We 每 层 都 存储 着 
: 1 个 字 市 的 数据 

Te ne 1 字 节 的 数据 

ge nl i 1 字 节 的 数据 


图 4-3 1KB 内 存 的 模型 

不 过 ， 程 序 员 眼 里 的 内 存 模型 中 ， 还 包含 着 物理 内 存 中 不 存在 的 
概念 ， 那 就 是 数据 类 型 。 编 程 语言 中 的 数据 类 型 表示 存储 的 是 何 种 类 
型 的 数据 。 从 内 存 来 看 ， 驶 是 占用 的 内 存 大 小 (占有 的 楼 层 数 ) 的 意 
思 。 即 使 是 物理 上 以 1 个 字 市 为 单位 来 逐一 读 写 数 据 的 内 存 ， 在 程序 
中 ， 通 过 指定 其 类 型 ( 变量 的 数据 类 型 等 )， 也 能 实现 以 特定 字 节 数 为 
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单位 来 进行 谈 写 。 

下 面 我 们 来 看 一 个 具体 的 示例 。 如 代码 清单 4-1 所 示 ， 这 是 一 个 往 
a、b、c 这 3 个 变量 中 写 入 数据 123 的 C 语言 程序 。 这 3 个 变量 表示 的 
是 内 存 的 特定 区 域 。 通 过 使 用 变量 ， 即 便 不 指定 物理 地 址 ， 也 可 以 在 
程序 中 对 内 存 进 行 恋 写 。 这 是 因为 ， 在 程序 运行 时 ，Windows 等 操作 


系统 会 日 动 决定 变量 的 物理 地 址 。 


代码 清单 4-1 各 种 类 型 的 变量 
VN 


char a; 
SnOrFE 10; 
en 


// 给 变量 赋值 
L235 
L229 
23s 


a 
b 
C 


这 3 个 变量 的 数据 类 型 分 别 是 ， 表 示 1 字 方 长 度 的 char， 表 示 2 
字 节 长 度 的 short， 以 及 表示 4 字 节 长 度 的 long 。 因 此 ， 虽 然 同 样 是 数 
据 123， 存 储 时 其 所 占用 的 内 存 大 小 是 不 一 样 的 。 这 里 ， 我 们 假定 采用 
的 是 将 数据 低位 存储 在 内 存 低 位 地 址 的 低 字 节 序 ( little endian ) “方式 
(图 4-4 )。 


J 在 C 语 言 中 ，int 这 一 数据 类 型 经 常会 用 到 。int 也 是 CPU 最 容易 处 理 的 数 
据 类 型 的 长 度 。 在 32 位 的 CPU 中 ，int 是 32 位 的 。 在 以 前 的 16 位 的 CPU 
中 ，int 是 16 位 的 。 

@ 将 多 字 节 数据 的 低位 字 节 存储 在 内 存 低位 地 址 的 方式 称 为 低 字 节 序 ， 与 此 
相反 ， 把 数据 的 高 位 字 节 存储 在 内 存 低位 的 方式 称 为 高 字 节 序 。 本 章 的 示 
例 图 中 使 用 的 是 奔腾 等 英特尔 处 理 器 所 采用 的 低 字 节 序 方式 。 
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地 址 


SREEE 

XXxXXXxXxXxXXX++1 
OCS 2 
CS 
XXXXXXXXXX 二 4 
XxXxXXXxXxXXXX++ 5 


XxXxXxXxxxXxxx+6 


内 存 地 址 x x x x x x x x x x 在 程序 执行 时 由 OS 而 定 


图 4-4 变量 的 数据 类 型 不 同 ， 所 占用 的 内 存 大 小 也 不 一 样 


仔细 思考 一 下 就 会 发 现 ， 根 据 程序 中 所 指定 的 变量 的 数据 类 型 的 
不 同 ， 读 写 的 物理 内 存 大 小 也 会 随 之 发 生变 化 ， 这 其 实 是 非常 方便 的 。 
大 家 不 妨 想 一 想 ， 假 如 程序 中 只 能 逐个 字 节 地 对 内 存 进 行 读 写 ， 那 该 
多 么 不 便 啊 。 在 处 理 超 过 1 个 字 节 的 数据 时 ， 还 必须 要 编写 分 割 处 理 
程序 。 此 外 ， 在 不 同 的 编程 语言 中 ， 变 量 可 以 指定 的 数据 类 型 的 最 大 
长 度 也 不 相同 。C 语言 中 ，8 字 节 (= 64 位 ) 的 double 类 型 是 最 大 的 。 


国 4.3 简单 的 指针 

接 下 来 ， 让 我 们 一 起 来 看 一 下 指针 。 指 针 是 C 语言 的 重要 特征 ， 
但 很 多 人 都 说 它 难 以 理解 ， 甚 至 还 有 人 因 无 法 理解 指针 而 对 C 语言 的 
学 习 产 生 了 很 强 的 挫败 感 。 Ce re nnd ne 
指针 应 该 很 容易 理解 。 理 解 指针 的 关键 点 就 是 要 弄 清楚 数据 类 型 这 
概念 。 
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指针 也 是 一 种 变量 ， 它 所 表示 的 不 是 数据 的 但 ， 而 是 存储 着 数据 
的 内 存 的 地 址 。 通 过 使 用 指针 ， 就 可 以 对 任意 指定 地 址 的 数据 进行 读 
写 。 虽 然 前 面 所 提 到 的 假想 内 存 IC 中 仪 有 10 位 地 址 信号 ， 但 大 家 在 
Windows 计算 机 上 使 用 的 程序 通常 都 是 32 位 (4 字 市 ) 的 内 存 地 址 。 
这 种 情况 下 ， 指 针 变 量 的 长 度 也 是 32 位 。 


请 大 家 看 一 下 代码 清单 442。 这 是 定义 ”了 d、e、f 这 3 个 指针 变量 
的 C 语 言 程序 。 和 通常 的 变量 定义 有 所 不 同 ， 在 定义 指针 时 ， 我 们 通 
常会 在 变量 名 前 加 一 个 星 号 (*)。 我 们 知道 ， 4、e、f 都 是 用 来 存储 
32 位 (4 字 节 ) 的 地 址 的 变量 。 然 而 ,为 什么 这 里 又 用 来 指定 char 
(1 字 节 )、short (2 字 节 )、long (4 字 节 ) 这 些 数据 类 型 呢 ? 大 家 是 不 
是 也 感到 很 奇怪 ?实际 上 ， 这 些 数据 类 型 表示 的 是 从 指针 存储 的 地 址 
中 一 次 能 够 读 写 的 数据 字 节 数 。 


代码 清单 4-2 各 种 数据 类 型 指针 的 定义 


char *d; ET 
Short *e; //short 类 型 的 指针 e 的 定义 
ame Ep //long 类 型 的 指针 ff 的 定义 


假设 4、e、f 的 值 都 是 100。 在 这 种 情况 下 ， 使 用 4 时 就 能 够 从 编 
号 100 的 地 址 中 读 写 1 个 字 节 的 数据 ,使 用 e 时 就 是 2 个 字 节 (100 地 
址 和 101 地 址 ) 的 数据 ， 使 用 f 时 就 是 4 个 字 节 (100 地 址 一 103 地 址 ) 
的 数据 。 怎 么 样 ? 指针 是 不 是 很 简单 呢 ( 图 4-5 )。 


(D 在 程序 中 ， 通 过 明确 标记 数据 类 型 来 记述 变量 的 过 程 称 为 定义 变量 。 例 如 ， 
若 将 其 记述 为 short a;， 则 表示 定义 了 2 个 字 节 的 short 类 型 的 变量 g。 变 量 
定义 后 就 可 以 进行 读 写 了 。 
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本 内 存 
中 针 指 定 的 地 址 用 指针 d 读 写 的 长 度 


人 
用 指针 e 读 写 的 长 度 


| 0 
地 101 是 于是 到 | [2 字 池 ] 
有 用 指针 f 读 写 的 长 度 


地 E108 


图 4.5 ”指针 的 数据 类 型 表示 一 次 可 以 读 写 的 长 度 


4.4 数组 是 高 效 使 用 内 存 的 基础 

下 面 让 我 们 回 到 主题 ， 解 释 一 下 本 章 标题 中 出 现 的 “熟练 使 用 有 楼 
有 角 的 内 存 ”。 在 葡 练 使 用 前 ， 我 们 先 来 看 一 下 内 存 最 直接 的 使 用 方 
法 。 在 这 里 ， 我 们 要 用 到 数组 。 


数组 是 指 多 个 同样 数据 类 型 的 数据 在 内 存 中 连续 排列 的 形式 。 作 
为 数组 元 素 的 各 个 数据 会 通过 连续 的 编号 被 区 分 开 来 ， 这 个 编号 称 
为 索引 ( index )。 指 定 索引 后 ， 就 可 以 对 该 索引 所 对 应 地 址 的 内 存 进 行 
读 写 操作 “。 而 索引 和 内 存 地 址 的 变换 工作 则 是 由 编译 器 自动 实现 的 。 


代码 清单 4-3 表示 的 是 在 C 语 言 中 定义 char 类 型 、short 类 型 和 
long 类 型 这 三 个 数组 。 用 括号 围 起 来 的 [100]， 表 示 数 组 的 元 素 有 100 
个 。 由 于 在 C 语言 中 ， 数 组 的 索引 是 从 0 开始 的 ， 因 此 ，charg[100]: 
表示 的 就 是 可 以 使 用 g[0] 一 g[99] 这 100 个 元 素 。 


Q) CPU 是 通过 利用 基 址 寄存 器 和 变 址 寄存 器 来 指定 内 存 地 址 的 ， 这 一 点 第 1 
章 中 已 经 进行 了 说 明 。 
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代码 清单 4-3 ”各 种 类 型 的 数组 定义 


enar Tiool /enar A EY 
short h[100]; //short 类 型 数组 bh 的 定义 
long i[100]; veno WA EY 


数组 的 定义 中 所 指定 的 数据 类 型 ， 也 表示 一 次 能 够 读 写 的 内 存 大 
小 。char 类 型 的 数组 以 1 个 字 市 为 单位 对 内 存 进行 谈 写 ， 而 short 类 型 
和 long 类 型 的 数组 则 分 别 以 2 个 字 节 、4 个 字 节 为 单位 对 内 存 进行 读 
写 。 数 组 是 使 用 内 存 的 基本 。 本 章 后 半 部 分 会 讲述 各 种 各 样 的 内 存 使 
用 技能 ， 其 中 每 一 种 都 需要 以 数组 为 基础 。 


之 所 以 说 数组 是 内 存 的 使 用 方法 的 基础 ， 是 因为 数组 和 内 存 的 物 
理 构 造 是 一 样 的。 特别 是 1 字 节 类 型 的 数组 ， 它 和 内 存 的 物理 构造 完 
全 一 致 。 不 过 ， 如 果 只 能 逐个 字 节 地 来 读 写 ， 程 序 就 会 变 得 比较 麻烦 ， 
因而 可 以 指定 任意 数据 类 型 来 定义 数组 。 这 和 将 1 层 = 1 单元 的 楼 房改 
造成 多 个 楼 层 = 1 单元 的 楼 房 是 同一 个 道理 ( 图 4-6 )。 


地 址 物理 内 存 eharoliool shornt hinool long i[100]; 
xxxx + 0 地 址 oo = 132 
Xxxxx 于 1 地 址 字 加 川 是 下 宁 
XX 2 主 gl 2 = T1538 
xxxx + 3 地 址 ol = | 
xxxx + 4 地 址 gd | 
xxxx + 5 地 址 g[5] = 1 字 节 
xxXxx + 6 地 址 gle Te 
xxxx 主 7 地 下 ol se 


| 相 加 的 数值 相当 于 索引 


4-6 不 同 数 据 类 型 的 数组 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


使 用 数组 能 够 使 编程 工作 变 得 更 加 高 效 。 如 果 在 反复 运行 的 循环 
处 理 ” 中 使 用 数组 ， 很 短 的 代码 就 能 达到 按 顺序 读 出 或 写 人 数组 元 素 的 
目的 。 不 过 ， 虽 然 是 通过 指定 索引 来 使 用 数组 ， 但 这 和 内 存 的 物理 读 
写 并 没有 特别 大 的 区 别 。 因 此 很 多 程序 都 会 在 数组 的 使 用 上 花费 大 量 
工夫 。 接 下 来 ， 我 们 就 向 大 家 介绍 一 下 栈 、 队 列 、 代 码 清单 和 二 又 查 


找 树 这 些 数 组 的 变形 方法 。 对 于 一 名 优秀 的 程序 员 来 说 ， 不 仅 要 了 解 ， 
还 要 会 灵活 使 用 这 些 方法 。 


团 4.5 栈 、 队 列 以 及 环形 缓冲 区 

栈 ” 和 队列 ， 都 可 以 不 通过 指定 地 址 和 索引 来 对 数组 的 元 素 进 行 读 
写 。 需 要 临时 保存 计算 过 程 中 的 数据 、 连 接 在 计算 机 上 的 设备 或 者 输入 
输出 的 数据 时 ， 都 可 以 通过 这 些 方法 来 使 用 内 存 。 如 果 每 次 保存 临时 数 
据 都 需 指 定 地 址 和 索引 ， 程 序 就 会 变 得 比较 麻烦 ， 因 此 要 加 以 改进 。 


栈 和 队列 的 区 别 在 于 数据 出 入 的 顺序 是 不 同 的 。 在 对 内 存 数据 进 
行 谈 写 时 ， 栈 用 的 是 LIFO ( Last Input First Out， 后 人 先 出 ) 方式 ， 而 
队列 用 的 则 是 FIFO (First Input First Out， 先 人 先 出 ) 方式 。 如 果 我 们 
在 内 存 中 预 留 出 栈 和 队列 所 需要 的 空间 ， 并 确定 好 写 入 和 读 出 的 顺序 ， 
就 不 用 再 指定 地 址 和 索引 了 。 


如 果 要 在 程序 中 实现 栈 和 队列 ， 就 需要 以 适当 的 元 素数 来 定义 一 
个 用 来 存储 数据 的 数组 ， 以 及 对 该 数组 进行 读 写 的 函数 对 。 当 然 ， 在 
这 些 函 数 的 内 部 ， 对 数组 的 讯 写 会 涉及 索引 的 管理 ,但 从 使 用 函数 的 
角度 来 说 ， 就 没有 必要 考虑 数组 及 索引 了 。 
(D 循环 处 理 (loop ) 是 指 反 复 多 次 进行 同样 的 处 理 。 


@) 这 里 所 说 的 栈 并 不 是 第 1 章 及 第 10 章 提 到 的 函数 调用 时 使 用 的 栈 ， 而 是 指 
程序 员 自 身 做 成 的 LIFO 形式 的 数据 存储 方式 (该 栈 的 实体 是 数组 )。 
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这 里 ， 我 们 暂且 把 往 栈 中 写 人 数据 的 函数 命名 为 Push ， 把 从 栈 中 
恋 出 数据 的 子 数 命名 为 Popp， 把 往 队 列 中 写 和 人 数据 的 函数 命名 为 
EnQueue， 把 从 队列 中 读 出 数据 的 函数 命名 为 DeQueue 。Push 和 Pop 
以 及 EnQueue 和 DeQueue 分 别 组 成 一 对 函数 。Push 和 EnQueue 用 于 为 
汕 数 的 参数 传递 要 写 人 的 数据 。Pop 和 DeQueue 用 于 将 该 出 的 数据 作 
为 少数 返回 值 返回 。 通 过 使 用 这 些 函 数 ， 可 以 将 数据 临时 保存 ( 写 入 )， 
然后 青 在 需要 时 候 把 这 些 数据 读 出 来 (代码 清单 4-4、 代 码 清单 4-5 )。 


代码 清单 4-4 ”使 用 栈 的 程序 示例 


// 往 栈 中 写 入 数据 

Bush (123), /le 
Push (456); 7 6 
Push (789) ; ye 
// 从 栈 中 读 出 数据 

j= RPROR // 读 出 789 
k = Pop(); // 读 出 456 
1 = Pop(); 7 R23 


代码 清单 4-5 使 用 队列 的 程序 示例 
// 往 队 列 中 写 入 数据 


EnQueue (123) ; J 
EnQueue (456) ; 5 
EnQueue (789) ; 5 
// 从 队列 中 读 出 数据 

mn = DeOUueue()，7/ 读 出 123 


); // 读 出 456 
) -997// 详 出 789 


n = DeQueue 
O = DeQueue 


虽然 示例 程序 中 没有 展示 实际 的 数组 以 及 Push、Pop、EnQueue、 


(DD 汇编 语言 中 有 push 和 pop 两 个 指令 ,但 这 里 指 的 是 程序 员 为 了 以 LIFO 形 
式 对 数组 进行 读 写 而 做 成 的 Push 函数 和 了 Pop 函数 。 

@) 通常 情况 下 ， 往 栈 写 入 数据 称 为 Push (入 栈 )， 从 栈 中 读 出 数据 称 为 Pop 
(出 栈 )。 往 队列 中 写 入 数据 称 为 EnQueue (入 列 )， 从 队列 中 读 出 数据 称 为 
DeQueue ( 出 列 )。 这 里 直接 把 它们 各 自 的 英文 名 称 作 为 函数 名 字 使 用 了 。 
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DeQueue 的 处 理 内 容 ， 不 过 还 是 希望 大 家 能 够 据 此 对 栈 及 队列 是 如 何 
使 用 内 存 的 有 一 个 大 体 印象 。 


顾名思义 ， 在 栈 中 ，LIFO 方式 表示 栈 的 数组 中 所 保存 的 最 后 面 的 
数据 ( Last In ) 会 被 最 先 读 取出 来 ( First Out )。 代 码 清单 4-4 的 程序 运 
行 后 ， 按 照 123、456、789 的 顺序 写 入 的 数据 ， 结 果 却 按照 789、456、 
123 的 顺序 被 读 取 出 来 (图 4-7 )。 


表示 栈 的 数组 Push(123): 运 行 后 。é Push(456): 运 行 后 Push(789): 运 行 后 


> -和 -和 


456 456 
129 23 


图 4-7 ”代码 清单 44 运行 时 栈 的 变化 


栈 的 原意 是 “干草 堆积 如 山 ”。 干 草 堆积 成 山 后 ， 最 后 堆 的 干草 会 
被 最 先 抽取 出 来 。 干 草 堆 也 是 用 来 临时 保存 家 禽 饲料 的 方式 。 程 序 中 
也 是 如 此 ， 为 了 实现 临时 保存 数据 的 目的 ， 使 用 这 种 类 似 于 干草 堆 的 
机 制 是 非常 方便 的 。 而 这 种 机 制 体现 在 内 在 上， 就 是 栈 。 当 我 们 需要 
暂时 舍弃 当前 的 数据 ， 随 后 再 原貌 还 原 时 ， 会 使 用 栈 ，。 


与 栈 相对 的 是 队列 ， 顾 名 思 义 ,FIFO 方式 表示 队列 的 数组 中 所 保 
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存 的 最 初 数据 ( First Input ) 会 最 先 被 读 取出 来 ( First Out )。 代 码 清单 
4-5 中 的 程序 运行 后 ， 按 照 123 、456、789 的 顺序 写 和 人 的 数据 ， 结 果 会 
按照 123 、456、789 的 顺序 被 读 取 出 来 ( 图 4-8)。 


表示 队列 的 数组 EnQueue(i 23)5 FnQueuel456), EnQueue(789); 
运行 后 运行 后 运行 后 
2 1 23 123 
456 456 


= 和 D> sD> 和 > 7Z89 


0 = DeOueue(): n = DeOueue(); Mm = DeOQOueue(); 
运行 后 运行 后 运行 后 


456 


< /89 < /89 


图 4-8 代码 清单 4-5 运行 时 队列 的 变化 


队列 这 一 方式 也 称 为 排队 。 排 队 指 的 是 灭 车 票 时 在 目 动 售票 机 前 
等 候 的 队列 等 。 排 队 时 ， 茹 在 最 前 面 的 乘客 先 严 票 ， 购 严 后 率先 从 队 
列 中 走出 来 。 当 随机 前 来 的 购 票 乘客 数量 和 目 动 售票 机 的 处 理 速 度 不 
相符 时 ， 排 队 能 起 到 很 好 的 缓冲 作用 。 程 序 中 也 是 如 此 ， 为 了 协调 好 
效 据 输入 和 处 理 时 机 间 的 关系 ， 采 用 类 似 于 排队 的 机 制 是 很 方便 的 。 
在 内 存 上 ， 实 现 这 种 机 制 的 方式 就 是 队列 。 当 我 们 需要 处 理 通讯 中 发 
送 的 数据 时 ， 或 由 同时 运行 的 多 个 程序 所 发 送 过 来 的 数据 时 ， 会 用 到 
这 种 对 队列 中 存储 的 不 规则 数据 进行 处 理 的 方法 。 


队列 一 般 是 以 环 状 缓冲 区 (ring buffer ) 的 方式 来 实现 的 ， 也 就 是 
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本 章 标 题 中 所 说 的 “ 束 练 使 用 有 棱 有 角 的 内 存 "。 例 如 ， 假 设 我 们 要 用 
有 6 个 元 素 的 数组 来 实现 一 个 队列 。 这 时 可 以 从 数组 的 起 始 位 置 开 始 
有 序 地 存储 数据 ， 然 后 再 按照 存储 时 的 顺序 把 数据 读 出 。 在 数组 的 末 
尾 写 人 数据 后 ， 后 一 个 数据 就 会 被 写 人 数组 的 起 始 位 置 ( 此 时 数据 已 经 
被 读 出 所 以 该 位 置 是 空 的 )。 这样， 数组 的 末尾 就 和 开头 连接 了 起 来 ， 
数据 的 写 入 和 读 出 也 就 循环 起 来 了 (图 4-9 )。 


下 一 个 要 读 出 的 位 置 下 一 个 要 读 出 的 位 置 


数据 1 


数据 3 数据 4 ”数据 3 


下 一 个 要 写 入 的 位 置 
下 一 个 要 写 入 的 位 置 


”图 4-9“ 环 状 缓冲 区 的 模型 


4.6 ”链表 使 元 素 的 追加 和 删除 更 容易 
接 下 来 介绍 的 链表 和 二 又 奋 找 树 ， 都 是 不 用 考虑 索引 的 顺序 就 可 
以 对 数组 元 素 进行 读 写 的 方式 。 通 过 使 用 链表 ， 可 以 更 加 高 效 地 对 数 
组 数据 (元素 ) 进行 妃 加 和 删除 处 理 。 而 通过 使 用 二 又 查找 树 ， 则 可 以 
更 加 蜗 效 地 对 数组 数据 进行 检索 。 

在 数组 的 各 个 元 系 中 ， 除 了 数据 的 值 之 外 ， 通 过 为 其 附 市 上 下 一 
个 元 素 的 索引 ， 即 可 实现 链表 。 数 据 的 值 和 下 一 个 元 系 的 索引 组 合 在 
一 起 ， 就 构成 了 数组 的 一 个 元 素 。 这 样 ， 数 组 元 系 相连 就 构成 了 念珠 
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似 的 链表 。 由 于 链表 末尾 的 元 系 没 有 后 续 的 数据 ， 因 此 就 需要 用 别 的 
值 (在 这 里 是 -1 ) 来 填充 (图 4-10 )。 


代码 清单 的 初始 位 置 


~ 


图 4-10 链表 的 示例 ( 初始 状态 ) 


在 需要 追加 或 删除 数据 的 情况 下 ， 使 用 链表 是 很 高 效 的 。 首 先 ， 
让 我 们 来 看 一 下 删除 的 情况 。 在 图 4-10 表示 的 链表 中 ， 假设 要 删除 从 
起 始 位 置 开 始 的 第 3 个 元 素 。 此 时 ， 我 们 只 需要 把 第 2 个 元 素 的 “下 一 
个 元 素 : 2” 变 成 “下 一 个 元 素 : 3” 即 可 。 由 于 数组 的 元 素 通 常 是 按照 
索引 顺序 来 引用 的 ， 因 此 当 我 们 需要 引用 构成 链表 的 数组 的 某 一 个 元 
素 时 ， 通 过 该 元 素 的 索引 信息 就 可 以 找到 下 一 个 元 素 。 当 第 2 个 元 
素 的 下 一 个 元 素 变 成 第 4 个 元 素 后 ， 那 么 第 3 个 元 素 就 被 删 除了 。 
虽然 第 3 个 元 素 在 物理 内 存 上 还 残留 着 ， 但 在 逻辑 上 则 确实 被 删除 了 
(图 4-11 )。 


接 下 来 就 让 我 们 来 看 一 下 如 何 往 链表 中 追加 数据 。 假 设 要 在 图 
4-10 的 链表 的 第 5 位 前 追加 一 个 新 数据 。 此 时 ， 我 们 只 需要 在 刚才 消 
除 的 第 3 个 元 系 的 位 置 中 保存 新 的 数据 ， 并 将 第 4 个 元 素 的 “下 一 个 元 
素 : 5” 变 更 成 “下 一 个 元 素 : 2”， 以 使 新 追加 的 元 素 的 索引 信息 变 成 
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“下 一 个 元 素 : $” 即 可 。 虽 然 新 追加 的 元 素 在 物理 上 是 第 3 个 ， 但 从 这 
辑 上 看 来 则 是 第 5 个 (图 4-12 )。 


把 2 变更 成 3 


该 元 素 被 从 链表 
中 删除 了 


| … 链表 的 链 


‘i 

ss 元 

四 222 

值 ，777 把 该 元 素 妃 加 到 
由 本 

信 555 

伯 ，666 

I ”和 二 


如 琳 不 使 用 链表 数组 ， 那 么 中 途 删 除 或 奶 加 元 系 时 ， 其 后 的 元 系 
就 必须 要 全 部 移动 。 示 例 中 数组 的 元 素 只 有 6 个， 处理 起 来 不 会 花费 
较 多 时 间 。 而 在 实际 的 程序 中 ， 有 时 需要 对 包含 数 千 至 数 万 个 元 素 的 
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数组 进行 频 芝 的 数据 退 加 或 删除 操作 。 如 果 每 次 部 需要 移动 数 干 至 数 
万 个 元 系 ， 那么 哪怕 是 高 速 计算 机 也 会 花费 很 长 时 间 (图 4-13、 图 
4-14 )。 反 之 ,使 用 代码 清单 来 退 加 或 删除 数据 则 时 不 费事 。 


删除 前 的 状态 删除 后 的 状态 
111 值 : 111 


p[O] 
请 想 要 删除 的 元 素 

p[1] 
S333 通过 移动 元 素 [2 BB 

Da 

一 WS 全 05 
i I> oe Bs 
: 666 


图 4-13 单纯 使 用 数组 的 情况 下 的 元 素 删 除 


值守 222 


BIS| 


追加 前 的 状态 追加 后 的 状态 
值 ，111 plO] 值 于 111 


信 、222 p[1] 值 : 222 


所 加 的 元 、 


值 : 666 值 : 777 


IN p[4] 
通过 移动 元 天 值 : 666 


p[5] 
来 挪 出 空间 


图 4-14 单纯 使 用 数组 的 情况 下 的 元 素 追 加 
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4.7 二 叉 查 找 树 使 数据 搜索 更 有 效 

二 又 查找 树 ”是 指 在 链表 的 基础 上 往 数 组 中 追加 元 素 时 ， 考 虑 到 数 
据 的 大 小 关系 ， 将 其 分 成 左右 两 个 方向 的 表现 形式 。 例 如 ， 假 设 我 们 
事先 把 50 这 个 值 保存 到 了 数组 中 。 那 么 ， 如 果 接 下 来 的 值 比 先前 保存 
的 数值 大 的 话 ， 就 要 将 其 放 到 右边 ， 反 之 如 果 小 的 话 就 放 在 左边 。 但 
实际 的 内 存 并 不 会 分 成 两 个 方向 ， 这 是 在 程序 逻辑 上 实现 的 (图 4-15 )。 


7 
NA_ 一” “和 过 到 大 的 数据 
4 、。 一 > … 链接 到 小 的 数据 


30 
AN 
17 41 


_ 图 4.15 二 又 查找 树 的 模型 将 树 映 倒 后 的 形状 ) 


6 


为 了 实现 二 义 查 找 树 ， 怎 么 处 理 比 较 好 呢 ? 其 实数 组 的 每 个 元 丸 
中 只 要 有 数据 的 值 和 两 个 索引 信息 就 可 以 了 。 图 4-16 四 我 们 展示 了 如 
何 用 数组 来 实现 图 4-14 中 的 二 又 查找 树 。 二 又 查 找 树 是 由 链表 构造 发 
展 而 来 的 表现 形式 ， 因 此 在 追加 或 删除 元 素 方面 也 同样 是 有 效 的 。 


使 用 二 又 查找 树 的 便利 之 处 在 于 可 以 使 数据 的 搜索 等 更 有 效率 。 
在 使 用 一 般 的 数组 时 ， 必 须 从 数组 的 开头 按照 索引 顺序 来 查找 目标 数 
据 。 而 使 用 二 叉 查 找 树 时 ， 当 目标 数据 比 现在 读 出 来 的 数据 小 时 就 可 
以 转 到 左 侧 ， 反 之 目标 数据 较 大 时 即 可 转 到 链表 的 右 侧 ， 这 样 就 加 快 
了 找到 目标 数据 的 速度 。 


QD 树 (tree ) 构造 指 的 是 数据 像 树 一 样 分 又 连接 的 方式 。 二 又 查找 树 也 是 树 构 
和 
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必须 理解 为 什么 
这 些 处 理 的 基础 。 


值 : 50 


pv pr 
右边 的 元 素 : 


值 : 30 


左边 的 元 素 : 
右边 的 元 素 : 


值 17 


左边 的 元 素 : 
右边 的 元 素 : 


值 : 41 


于 这 的 元 过， 
右边 的 元 素 : 


但 上 5 


左边 的 元 素 : 
右边 的 元 素 : 


值 : 63 


左边 的 元 素 : 
右边 的 元 素 : 


值 : 84 


左边 的 元 素 : 
右边 的 元 素 : 
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只 要 在 程序 开发 中 多 花 一 些 心思 ， et 
ovina 一 点 想必 大 家 都 清楚 
四 和 


行 这 些 处 理 。 男 外 ， 请 大 家 牢 


链表 的 开头 


| 
' 


Y … 链接 到 大 的 数据 


Y 链接 到 小 的 数据 


、 图 4.16 使 用 数组 来 实现 二 X 查 找 村 


下 一 章 ， 我 们 将 会 介绍 磁盘 。 和 内 存 一 样 ， 和 
据 的 。 磁 盘 虽 然 在 物理 方面 只 
序 中 多 花 一 些 心思 ， 


能 以 面 区 为 单位 进行 读 写 ， 但 通过 在 程 


磁盘 也 可 以 以 各 种 形态 来 使 用 。 我 们 也 会 
对 用 磁盘 符 代 内 存 来 使 用 的 虚拟 内 存 进行 说 明 。 
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9 类 | 身 | 问 | 答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


. 存储 程序 方式 指 的 是 什么 ? 

. 通过 使 用 内 存 来 提高 磁盘 访问 速度 的 机 制 称 为 什么 ? 

. 把 磁盘 的 一 部 分 作为 假想 内 存 来 使 用 的 机 制 称 为 什么 ? 

. Windows 中 ， 在 程序 运行 时 ， 和 存储 着 可 以 动态 加 载 调用 的 
函数 和 数据 的 文件 称 为 什么 ? 

. 在 EXE 程序 文件 中 ， 静 态 加 载 函 数 的 方式 称 为 什么 ? 

6. 在 Windows 计算 机 中 ， 一 般 磁盘 的 1 个 届 区 是 多 少 字 证 ? 


2 
3 
4 


oO 
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么 样 ? 是 不 是 发 现 有 一 些 问 题 无 法 简单 地 解释 清楚 呢 ? 下 面 
是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


. 在 存储 装置 中 保存 程序 ， 并 逐一 运行 的 万 式 
. Disk Cache ( 磁盘 缓存 ) 

. 虚拟 内 存 ( virtual memory ) 

. DLL ( DLL 文件 ) 

. 静态 链接 

. 512 字 节 


， 现 在 计算 机 采用 的 是 存储 程序 方式 。 
。 磁盘 缓存 是 指 ， 把 从 磁盘 中 读 出 的 数据 存储 在 内 存 中 ， 当 该 数 


据 再 次 被 谈 取 时 ， 不 是 从 磁盘 而 是 百 接 从 内 存 中 高 速 该 出 。 


.借助 虚拟 内 存 ， 哪 怕 是 内 存 容量 不 足 的 计算 机 ， 也 可 以 运行 很 


大 的 程序 。 


. DLL 是 Dynamic Link Liabrary 的 略称 。 
， 因数 的 加 载 方 式 有 静态 链接 和 动态 链接 两 种 。 
.局 区 是 磁盘 保存 数据 的 物理 单位 。 
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从 都 具有 存储 程序 命令 和 数据 这 点 来 看 ， 内 存 和 
磁盘 的 功能 是 相同 的 。 在 计算 机 的 5 大 部 件 中 ， 内 存 
和 磁盘 也 都 被 归 类 为 存储 部 件 。 不 过 ， 利 用 电流 来 实现 存储 的 内 存 ， 
同 利 用 磁 效 应 来 实现 存储 的 磁盘 ， 还 是 有 差异 的 。 而 从 存储 容量 来 看 ， 
内 存 是 高 速 高 价 ， 而 磁盘 则 是 低速 廉价 。 


大 家 平时 使 用 的 计算 机 ， 至少 都 配备 了 512M 大 小 的 内 存 和 80GB 
大 小 的 磁盘 。 在 计算 机 这 个 系统 中 ， 高 速 小 容量 的 内 存 与 低速 高 容量 
的 磁盘 进行 协同 作业 。 本 章 就 让 我 们 来 看 一 下 内 存 和 磁盘 的 亲密 关系 。 
在 下 文中 ， 内 存 主要 是 指 主 内 存 ( 负责 存储 CPU 中 运行 的 程序 指令 和 
数据 的 内 存 )， 磁 盘 主 要 是 指 硬盘 。 


5.1 不 读 入 内 存 就 无 法 运行 
考虑 内 存 和 磁盘 的 关系 之 前 ， 我 们 首先 来 看 一 个 前 提 性 的 问题 。 


程序 保存 在 存储 设备 中 ， 通 过 有 序 地 被 读 出 来 实现 运行 ， 这 一 点 
大 家 都 很 清楚 。 这 一 机 制 称 为 存储 程序 方式 ( 程序 内 置 方式 )， 现 在 看 
ee 但 在 当时 它 的 提出 可 以 说 是 一 个 里 程 碑 。 为 什么 

这 么 说 呢 ? 因为 在 此 以 前 的 程序 都 是 通过 改变 计算 机 的 布线 等 来 变更 
程序 的 。 


计算 机 中 主要 的 存储 部 件 是 内 存 和 磁盘 。 磁 盘 中 存储 的 程序 ， 必 
须要 加 载 到 内 存 后 才能 运行 。 在 磁盘 中 保存 的 原始 程序 是 无 法 直接 运 
行 的 。 这 是 因为 ， 负 责 解析 和 运行 程序 内 容 的 CPU， 需要 通过 内 部 程 


一 般 把 输入 装置 、 输 出 装置 、 存 储 器 、 运 算 器 和 控制 器 这 $ 种 部 件 设备 称 
为 计算 机 的 5 大 部 件 。 
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序 计数 器 来 指定 内 存 地 址 , 然后 才能 读 出 程序 。 即 使 CPU 可 以 直接 读 
出 并 运行 磁盘 中 保存 的 程序 ， 由 于 磁盘 读 取 速 度 慢 ， 程 序 的 运行 速度 
还 是 会 降低 。 总 之 ， 存储 在 磁盘 中 的 程序 需要 读 人 到 内 存 后 才能 运行 。 
在 考虑 内 存 和 磁盘 的 关系 之 前 ， 大 家 一 定 要 了 解 这 个 前 提 ( 图 5-1 )。 


图 5-1 程序 要 加 载 到 内 存 后 才 开 始 运行 
在 这 个 大 前 提 的 基础 上 ， 内 存 和 磁盘 之 间 存 在 着 许多 杀 密 关系 。 
接 下 来 我 们 逐一 说 明 。 


转 5.2 磁盘 缓存 加 快 了 磁盘 访问 速度 

作为 体现 内 存 和 磁盘 亲密 关系 的 第 一 个 示例 ， 首 先 让 我 们 来 看 一 
下 磁盘 缓存 ( disk cache ) 。 磁盘 缓存 指 的 是 把 从 磁盘 中 读 出 的 数据 存储 
到 内 存 空间 中 的 方式 。 这 样 一 来 ， 当 接 下 来 需要 读 取 同一 数据 时 ， 就 
不 用 通过 实际 的 磁盘 ， 而 是 从 磁盘 缓存 中 把 内 容 读 出 。 使 用 磁盘 缓存 
可 以 大 大 改善 磁盘 数据 的 访问 速度 ( 图 5-2 )。 


QD 详情 请 参考 第 1 章 。 
@) 磁盘 缓存 的 缓存 ( cache ) 是 高 速 缓存 、 仓 库 的 意思 。 
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使 用 数据 的 应 用 
(1 ) 首次 读 出 时 从 磁盘 读 出 ( 3 ) 再 次 读 取 同 一 


( 低速 ) 数据 时 从 内 存 


读 出 ( 高 速 ) 
( 2 ) 保存 读 出 的 

和 数据 

数据 ES 的 > 


内 存 的 一 部 分 
( 磁盘 缓存 ) 


和 

Windows 提供 了 磁盘 缓存 机 制作 为 操作 系统 。 不 过 ， 对 普通 用 户 
来 说 ， 傍 盘 缓 存 发 挥 显 若 效 末 的 时 代 只 延续 到 Windows 95/98。 现 在 ， 随 
着 便 盘 访问 速度 的 大 幅 改善 ， 人 磁盘 缓存 的 效 末 也 没有 之 前 那么 明显 了 。 


把 低速 设备 的 数据 保存 在 高 速 设 备 中 ， 需 要 时 可 以 直接 将 其 从 高 
速 设 备 中 谈 出 ， 这 种 缓存 的 方式 在 其 他 情况 下 也 会 用 到 。 其 中 的 一 个 
实例 就 是 在 Web 浏览 器 中 的 使 用 。 由 于 Web 浏览 器 是 通过 网 络 来 获取 
远程 Web 服务 器 的 数据 并 将 其 显示 出 来 的 。 因 此 ， 在 显示 较 大 的 图 片 
等 文件 时 ， 会 花费 不 少时 间 。 于 是 ，Web 浏览 器 就 可 以 把 获取 的 数据 
暂时 保存 在 磁盘 中 ， 然 后 在 需要 时 再 显示 磁盘 中 的 数据 。 也 就 是 说 ， 
把 低速 的 网 络 数据 保存 到 相对 高 速 的 磁盘 中 。 


[ 国 5.3 虚拟 内 存 把 磁盘 作为 部 分 内 存 来 使 用 

接 下 来 就 让 我 们 来 看 一 下 体现 内 存 和 磁盘 亲密 关系 的 第 二 个 示例 ， 
即 虚 拟 内 存 ( virtual memory )。 虚 拟 内 存 是 指 把 磁盘 的 一 部 分 作为 假想 
的 内 存 来 使 用 。 这 与 磁盘 缓存 是 假想 的 磁盘 (实际 上 是 内 存 ) 相对 ， 虚 
拟 内 存 是 假想 的 内 存 ( 实 际 上 是 磁盘 )。 
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通过 借助 虚拟 内 存 ， 在 内 存 不 足 时 也 可 以 运行 程序 。 例 如 ， 在 只 
剩 下 SMB 内 存 空 间 的 情况 下 也 能 运行 10MB 大 小 的 程序 。 不 过 ， 就 如 


本 章 开 头 所 讲述 的 那样 ，CPU 只 能 执行 加 载 到 内 存 中 的 程序 。 虚 拟 内 
存 虽 说 是 把 磁盘 作为 内 存 的 一 部 分 来 使 用 ， 但 实际 上 正在 运行 的 程序 
部 分 ， 在 这 个 时 间 点 上 是 必须 存在 在 内 存 中 的 。 也 就 是 次 ， 为 了 实现 
虚拟 内 存 ， 就 必须 把 实际 内 存 ( 也 可 称 为 物理 内 存 ) 的 内 容 ， 和 磁盘 上 
的 虚拟 内 存 的 内 容 进 行 部 分 置换 (swap )， 并 同时 运行 程序 。 


刚才 已 经 说 过 ，Windows 提供 了 虚拟 内 存 机 制作 为 操作 系统 。 在 
当前 的 Windows 中 ， 虚 拟 内 存 依然 发 挥 着 很 大 的 作用 。 虚 拟 内 存 的 方 
法 有 分 页 式 和 分 段 式 ”两 种 。Windows 采用 的 是 分 页 式 。 该 方式 是 指 ， 
在 不 考虑 程序 构造 的 情况 下 ， 把 运行 的 程序 按照 一 定 大 小 的 页 ( page ) 
进行 分 制 ， 并 以 页 为 单位 在 内 存 和 磁盘 间 进 行 置换 。 在 分 页 式 中 ,我 
们 把 磁盘 的 内 容 读 出 到 内 存 称 为 Page mm， 把 内 存 的 内 容 写 人 磁盘 称 为 
Page Out。 一 般 情 况 下 ，Windows 计算 机 的 页 的 大 小 是 4KB。 也 就 是 
说 ， 把 大 程序 用 4KB 的 页 来 进行 切 分 ， 并 以 页 为 单位 放 入 磁盘 (虚拟 
内 存 ) 或 内 存 中 (图 5-3 )。 


为 了 实现 虚拟 内 存 功能 ，Windows 在 磁盘 上 提供 了 虚拟 内 存 用 的 
文件 (page file， 页 文件 )。 该 文件 由 Windows 目 动 做 成 和 管理 。 文 件 
的 大 小 也 就 是 虚拟 内 存 的 大 小 ， 通 第 是 实际 内 存 的 相同 程度 至 两 倍 程 
度 。 通 过 Windows 的 控制 面板 ， 可 以 查看 或 变更 当前 虚拟 内 存 的 设 定 。 


下 面 就 让 我 们 来 看 一 下 虚拟 内 存 的 设 定 。 作 者 目 己 的 计算 机 是 
2GB 的 内 存 。 当 前 的 页 文件 的 大 小 是 2345MB = 2GB( 图 5-4 )。 


Q) 分 段 式 虚拟 内 存 是 指 ， 把 要 运行 的 程序 分 割 成 以 处 理 集合 及 数据 集合 等 为 


单位 的 段落 ， 然 后 再 以 分 割 后 的 段落 为 单位 在 内 存 和 磁盘 之 间 进 行 数据 
置 挨 。 
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需要 运行 的 部 分 Page In， 不 需 
运行 的 部 分 Page Out 把 1 个 程序 划分 成 
多 个 页 


图 5-3 分 页 式 虚拟 内 存 的 机 制 


处 理 器 计划 

选择 如 何 分 配 处 理 器 资源 。 
调整 以 优化 性 能 : 

回程 序 全 ) 日 后 台 服 务 G) 


虚拟 内 存 
角 中 文件 是 宣 盘 上 的 一 块 区 域 ， Windows 当 作 EAM 使 


所 有 驱动 器 总 分 页 文件 大 小 : 当前 页 文件 的 大 小 


ED ED [机 由 


图 5-4 ”查看 虚拟 内 存 的 设 定 
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国 5.4 节约 内 存 的 编程 方法 
以 图 形 用 户 界 面 (GUI，Graphical User Interface ) “为 基础 的 
Windows， 可 以 说 是 一 个 巨大 的 操作 系统 。Windows 的 前 身 是 MS-DOS 


操作 系统 ， 最 初版 本 可 以 在 128KB 左右 的 内 存 上 运行 ， 而 想 要 
Windows 流畅 运行 的 话 ， 至 少 需 要 512MB 的 内 存 。 而 且 ， 由 于 
Windows 具有 多 任务 功能 ， 在 巨大 的 Windows 操作 系统 中 可 以 同时 运 
行 多 个 应 用 ， 因 此 ， 即 使 是 512MB 的 内 存 ， 有 时 也 无 法 保证 流畅 运 
行 。Windows 操作 系统 经 常 为 内 存 不 足 所 困 。 


许多 人 可 能 会 认为 ,通过 借助 磁盘 虚拟 内 存 就 可 以 解决 内 存 不 足 
的 问题 。 而 虚拟 内 存 也 确实 能 避免 因 内 存 不 足 导 致 的 应 用 无 法 局 动 。 
不 过 ， 由 于 使 用 虚拟 内 存 时 发 生 的 Page In 和 Page Out 往往 伴随 者 低速 
的 磁盘 访问 ， 因 此 在 这 个 过 程 中 应 用 的 运行 会 变 得 迟钝 起 来 。 想 必 大 
家 也 都 有 过 在 操作 应 用 的 过 程 中 硬盘 访问 灯 一 直 亮 看 (这 时 正在 进行 
Page In 和 Page Out )， 导 致 应 用 一 时 无 法 操作 的 不 愉快 经 历 吧 。 也 束 是 
说 ， 虚 拟 内 存 无 法 彻底 解决 内 存 不 足 的 问题 。 


为 了 从 根本 上 解决 内 存 不 足 的 问题 ， 需 要 增加 内 存 的 容量 ， 或 者 
尽量 把 运行 的 应 用 文件 变 小 。 接 下 来 会 回 大 家 介绍 两 个 把 应 用 文件 变 
小 的 编程 方法 。 虽 然 增加 内 存 容 量 更 为 便捷 ， 但 是 花费 也 高 ， 所 以 大 
家 还 旦 需要 先 看 一 下 口袋 里 面 的 银子 笛 来 做 决定 。 


(DD 像 Windows 这 样 ， 窗 口 的 菜单 及 图 表 等 都 可 以 进行 可 视 化 操作 的 方式 称 为 
图 形 用 户 界 面 。Windows 的 前 身 MS-DOS 操作 系统 ， 是 由 键盘 输入 命令 来 
进行 操作 的 CLI (命令 行 界面 )。 
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( 1 ) 通过 DLL 文件 实现 函数 共有 

DLL( Dynamic Link Library ) 文件 ， 顾名思义 ,是 在 程序 运行 时 可 
以 动态 加 载 Library ( 函数 和 数据 的 集合 ) 的 文件 。 此 外 ， 还 有 一 个 需要 
大 家 注意 的 地 方 ， 那 就 是 多 个 应 用 可 以 共有 同一 个 DLL 文件 。 而 通过 
共有 同一 个 DLL 文件 则 可 以 达到 节约 内 存 的 效果 。 


例如 ， 假 设 我 们 编写 了 一 个 具有 某 些 处 理 功 能 的 吨 数 MyFunc()。 
应 用 A 和 应 用 B 都 会 使 用 这 个 函数 。 在 各 个 应 用 的 运行 文件 中 内 置 函 
数 MyFunc()( 这 个 称 为 Static Link， 毅 态 链接 ) 后 同时 运行 这 两 个 应 
用 ， 内 存 中 束 存 在 了 具有 同一 函数 的 两 个 程序 。 但 这 会 导致 内 存 的 利 
用 效率 降低 。 所 以 ， 有 两 个 同样 的 函数 ， 还 是 有 点 浪费 (图 5-5 )。 


应 BT 


内 存 中 有 两 个 相同 的 函数 


5-5 ”静态 链接 导致 内 存 利用 效率 下 降 


那么 MyFunc() 是 独立 的 DLL 文件 而 不 是 应 用 的 执行 
文件 (EXE 文件 )， 那 结 果 会 怎样 呢 ” 由 于 同一 个 DLL 文件 的 内 容 在 
运行 时 可 以 被 多 个 应 用 共有 ， 因 此 内 存 中 存在 的 函数 MyFunc() 的 程序 


Q) 关于 DLL 文件， 会 在 第 8 章 进 行 详细 说 明 。 

(2 Windows 中 ， 可 以 执行 的 应 用 文件 的 扩展 名 是 .exe， 这 样 的 文件 就 称 为 
EXE 文件 。exe 是 executable ( 可 执行 ) 的 略 写 。 另 一 方面 ，DLL 文件 的 扩 
展 名 为 .dll。 
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就 只 有 1 个。 这 样 一 来 ， 内 存 的 利用 效率 也 就 提高 了 。 


将 函数 MyFunc() 设 置 为 DLL 文件 ， 
就 可 以 由 两 个 应 用 程序 共享 


图 5-6 ”进行 动态 链接 的 话 即 可 节约 内 存 


Windows 的 操作 系统 本 号 也 是 多 个 DLL 文件 的 集合 体 。 有 时 在 安 


装 新 应 用 时 ，DLL 文件 也 会 被 妃 加 。 应 用 则 会 通过 利用 这 些 DLL 文件 
的 功能 来 运行 。 像 这 样 ， 之 所 以 要 利用 多 个 DLL 文件 ， 其 中 一 个 原因 
ah 而 且 DLL 文件 还 有 一 个 优点 就 是 ， 在 不 变更 EXE 
文件 的 情况 下 ， 只 通过 升级 DLL 文件 就 可 以 更 新 。 


(2 ) 通 


调用 _stdcall 来 减 小 程序 文件 的 大 小 
通过 调用 stdcall Oe 是 用 C 语 言 编写 应 用 


时 可 以 利用 的 高 级 技巧 。 不 过 ， 这 一 思路 应 该 也 可 以 应 用 在 其 他 编程 
语言 中 ， 因 此 大 家 一 定 要 记 住 。 


由 


_stdcall 是 standard call ( 标准 调用 ) 的 略称 。Windwos 提供 的 DLL 文件 内 


的 函数 ， 基 本 上 都 是 _stdcall 调用 方式 。 这 主要 是 为 了 节约 内 存 。 另 一 方 
面 ， 用 C 语言 编写 的 程序 内 的 函数 ， 默 认 设置 都 不 是 stdcall。C 语言 特有 
的 调用 方式 称 为 C 调用 。C 语言 之 所 以 默认 不 使 用 stdcall， 是 因为 C 语言 
所 对 应 的 函数 的 传 入 参数 是 可 变 的 ( 可 以 设 定 任意 参数 )， 只 有 函数 调用 方 
才能 知道 到 底 有 多 少 个 参数 ， 而 这 种 情况 下 ， 栈 的 清理 作业 便 无 法 进行 。 

不 过 ， 在 C 语 言 中 ， 如 果 函 数 的 参数 数量 固定 的 话 ， 指 定 stdcall 是 没有 
任何 问题 的 。 
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CC 语言 中 ， 在 调用 函数 后 ， 需 要 执行 栈 清理 处 理 指令 。 酸 清理 
处 理 是 指 ， 把 不 宽 要 的 数据 从 接收 和 传递 函数 的 参数 时 使 用 的 内 存 
上 的 栈 区 域 中 清理 出 去 。 该 命令 不 是 程序 记述 的 ， 而 是 在 程序 编译 
时 由 编译 帮 目 动 附加 到 程序 中 的 。 编 详 各 默认 将 该 处 理 附加 在 函数 
调用 方 。 


例如 ， 在 代码 清单 5-1 中 ， 从 机 数 main0 中 调用 了 四 数 MyFunc()。 
按照 默认 设 定 ， 栈 的 清理 处 理会 附加 在 函数 main0 这 一 方 。 在 同一 个 
程序 中 ， 同 样 的 函数 可 能 会 被 多 次 反复 调用 。 而 如 有 果 是 同样 的 函数 ， 
栈 清 理 处 理 的 内 容 也 是 一 样 的 。 由 于 该 处 理 是 在 调用 也 数 一 方 ， 因 此 
就 会 导致 同一 处 理 被 反复 进行 。 这 就 造成 了 内 存 的 浪费 。 
代码 清单 5-1 C 语言 的 函数 调用 程序 示例 
// 函数 调用 方 


vole mailnt() 


{ 


二 前世 有 &? 

有 三 Mivne(l23, 456); 
} 
// 被 调用 方 
nale Ve 


人 
} 


虽然 通过 调查 编译 益生 成 的 机 各 语 言 执行 文件 就 可 以 得 知 栈 清理 
的 处 理 内 容 ， 不 过 鉴于 原始 的 机 各 语言 不 太 容 易 理 解 ， 所 以 这 里 我 们 
用 汇编 语言 的 代码 清单 将 其 显示 了 出 来 。 将 代码 清单 5-1 中 调用 函数 
MyFunc() 的 部 分 用 汇编 语言 来 表示 ， 就 如 代码 清单 5-2 所 示 。 最 后 1 
行 的 处 理 就 是 清理 处 理 。 
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代码 清单 5-2 调用 MyFunc() 的 部 分 程序 ( 汇编 语言 


a 二 将 参数 456 (= 1lc8h) 存 入 栈 中 
push 7Bh 二 将 参数 123 (= 7Bh) 存 入 栈 中 


call @LTD+15 (MyFunc) (00401014) < 调用 MyFunc () 函数 
add esp，8 ”< 运行 栈 清理 


C 语言 通过 栈 来 传递 函数 的 参数 。push 是 往 栈 中 存 人 数据 的 指令 。 
32 位 CPU 中 ，1 次 push 指令 可 以 存储 4 个 字 节 的 数据 。 代 码 清单 5-2 
中 ， 由 于 使 用 了 两 次 push 指令 把 两 个 参数 (456 和 123 ) 存 人 到 了 栈 
中 ， 因 此 总 的 来 说 就 是 存储 了 8 字 节 的 数据 。 通 过 call 指令 调用 函数 
MyFunc() 后 ， 栈 中 存储 的 数据 就 不 再 需要 了 。 于 是 这 时 就 通过 add 
esp, 8 这 个 指令 , 使 存储 着 栈 数据 的 esp 寄存 器 ”前 进 8 位 ( 设 定 为 指向 
高 8 位 字 节 地 址 )， 来 进行 数据 清理 。 由 于 栈 是 在 各 种 情况 下 都 可 以 再 
利用 的 内 存 领 域 ， 因 此 使 用 完毕 后 有 必要 将 其 恢复 到 原状 态 。 上 述 这 
些 操作 就 是 栈 的 清理 处 理 。 另 外 ,在 C 语言 中 ， 函 数 的 返回 值 ， 是 通 
过 寄存 器 而 非 栈 来 返回 的 。 


栈 清 理 处 理 ， 比 起 在 函数 调用 方 进行 ， 在 反复 被 调用 的 函数 一 方 进 
行 时 ， 程 序 整 体 要 小 一 些 。 这 时 所 使 用 的 就 是 _stdcall。 在 函数 前 加 上 
_stdcall， 就 可 以 把 栈 清理 处 理 变 为 在 被 调用 也 数 一 方 进行 。 把 代码 清单 
5-1 中 的 int MyFunc(int a, int b) 部 分 转 成 int stdcall MyFunc(int a, int b) 
进行 再 编译 后 ， 和 代码 清单 5-2 中 add esp, 8 同样 的 处 理 束 会 在 水 数 
MyFunc0 一 方 执 行 。 虽 然 该 处 理 只 能 市 约 3 个 字 节 (add esp, 8 是 机 各 语 


Q) CPU 会 提前 准备 好 栈 机 制 。 往 栈 中 存储 数据 的 汇编 语言 指令 是 push。 从 栈 
中 取出 数据 的 汇编 语言 指令 是 pop。 栈 一 般 是 用 来 实现 函数 调用 机 制 的 。 
如 果 想 任意 利用 栈 ， 程 序 员 就 需要 自己 用 程序 来 实现 所 需要 的 栈 机 制 。 

(2) CPU 中 ， 栈 中 堆积 的 最 高 位 的 数据 地 址 是 保存 在 esp (esp 是 Pentium 系列 
CPU 的 栈 指针 名 ) 中 的 。 连 续 运行 两 次 pop 指令 ， 可 以 消除 两 个 存储 在 栈 
中 的 4 字 节 数据 ， 而 同样 的 功能 也 可 以 通过 把 esp 的 数值 加 8 来 实现 。 
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的 3 个 字 市 ) 的 程序 大 小 ， 不 过 在 整个 程序 中 还 是 有 效 末 的 ( 图 5-7 )。 


在 调用 方 处 理 时 


函数 MyFunc() 


在 被 调用 方 处 理 时 
内 存 


多 次 进行 相 3 
同 的 处 理 造 
成 浪费 


一 » 


只 有 一 个 相同 
的 处 理 


feal sel ss TN 于 
再 上 用 XIVIly Func!() 


图 5-7 在 被 调用 方 进行 清理 处 理 可 节约 内 存 


国 5.5 磁盘 的 物理 结构 
第 4 章 中 我 们 介绍 了 内 存 的 物理 结构 ， 本 章 就 让 我 们 来 看 一 下 磁 
盘 的 物理 结构 。 磁 盘 的 物理 结构 是 指 磁盘 存储 数据 的 形式 。 


磁盘 是 通过 把 其 物理 表面 划分 成 多 个 空间 来 使 用 的 。 划 分 的 方式 
有 局 区 方式 和 可 变 长 方式 两 种 ， 前 者 是 指 将 磁盘 划分 为 回 定 长 度 的 衬 
间 ， 后 者 则 是 指 把 磁盘 划分 为 长 度 可 变 的 空间 。 一 般 的 Windows 计算 
机 所 使 用 的 人 硬盘 和 软盘 ， 采 用 的 都 是 局 区 方式 。 刷 区 方式 中 ， 把 们 盘 
表面 分 成 右 干 个 同心 圆 的 空间 就 是 磁道 ， 把 磁道 按照 固定 大 小 【能 存储 
的 数据 长 度 相 同 ) 划分 而 成 的 空间 网 是 局 区 (图 5-8 )。 
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,图 5-8 局 区 方式 的 磁盘 物理 构造 


户 区 是 对 磁盘 进行 物理 读 写 的 最 小 单位 。Windows 中 使 用 的 磁盘 ， 
一 般 1 个 扇 区 是 512 字 节 。 不 过 ，Windows 在 逻辑 方面 (软件 方面 ) 对 
人 磁盘 进行 读 写 的 单位 是 月 区 整数 倍 徐 。 根 据 磁 盘 容 量 的 不 同 ，1 簇 可 以 
是 512 字 节 (1 徐 =1 户 区 ) 、1KB (1 徐 =2 肩 区 )、2KB、4KB、8KB、 
16KB、32KB (1 簇 = 64 启 区 )。 磁 盘 的 容量 越 大 ， 复 的 容量 也 越 大 。 
不 过 ， 在 软盘 中 ，1 复 = $12 字 节 = 1 扇 区 ， 复 和 扇 区 的 大 小 是 相等 的 。 


不 管 是 便 盘 还 是 软盘 ,不同 的 文件 是 不 能 存储 在 同一 个 禾 中 的 ， 
个 则 就 会 导致 只 有 一 方 的 文件 不 能 被 删除 。 因 此 ， 不 管 是 多 么 小 的 文 
件 ， 都 会 占用 1 复 的 空间 。 这 样 一 来 ， 所 有 的 文件 都 会 占用 1 复 的 整 
数 倍 的 磁盘 空间 。 我 们 可 以 通过 试验 来 确认 这 一 点 。 


由 于 在 硬盘 上 做 试验 比较 麻烦 ， 所 以 我 们 选择 在 软盘 上 进行 。 首 
先 ， 把 软盘 按照 “1.44MB ，512 字 节 / 扇 区 ”进行 格式 化 。 软 盘 中 ， 
1 虱 区 = 1 禾 。 格 式 化 完成 后 ， 我 们 可 以 看 一 下 磁盘 的 属性 ， 这 时 的 已 
用 空间 应 该 是 0 字 节 ， 因 为 没有 存储 任何 文件 (图 5-9 )。 
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类 型 软盘 驱动 器 
文件 系统 : FAT 


国 已 用 空间 : 
国 可 用 空间 : 1, 457, 664 字 节 


容量 : 1 457, 664 字 节 


驱动 器 上 : 


_ 图 5-9 格式 化 后 磁盘 的 已 用 空间 是 0 字 节 


接 下 来 ， 让 我 们 用 记事 本 等 文本 编辑 工具 ”做 成 一 个 只 有 1 个 半角 
文字 的 文件 ， 并 将 其 保存 到 软盘 中 ， 然 后 再 来 看 一 下 磁盘 的 属性 。 这 
时 我 们 就 会 发 现 ， 虽 然 文件 的 大 小 只 有 1 字 节 ， 但 使 用 空间 却 变 成 了 
512 学 廊 。 


再 次 打开 上 述 文件 ， 并 增加 一 些 文字 ， 然 后 覆盖 保存 。 这 时 再 查 
看 一 下 人 磁盘 的 属性 就 会 发 现 ， 当 文件 大 小 未 达到 512 个 半角 文字 
(=512 字 节 ) 时, 已 用 空间 一 直 是 512 字 节 。 一旦 达到 513 个 文字 , 已 
用 空间 就 会 一 下 子 变 成 1024 字 节 (=2 复 )。 通过 这 个 实验 ， 想必 大 家 
都 应 该 明白 磁盘 的 数据 保存 是 以 簇 为 单位 来 进行 了 吧 (图 5-10 )。 


@ 文本 编辑 工具 指 的 是 像 简易 的 文字 处 理 机 那样 可 以 输入 文字 的 应 用 。 标 准 
的 Windows 中 都 带 有 记事 本 (notepad.exe ) 这 一 文字 编辑 工具 。 
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软盘 驱动 器 
文件 系统 : FAT 


国 可 用 空间 : 1, 457, 152 字 节 


容重: 1, 457, 664 字 节 


驱动 器 A: 


图 5-10 ” 仅 有 1 个 文字 也 会 占用 1 条 (512 字 市 ) 本 


以 复 为 单位 进行 读 写 时 ，!1 禾 中 没有 填 满 的 区 域 会 保持 不 被 使 用 的 
状态 。 虽 然 这 看 起 来 吓 有 氮 当 费 ， 不 过 该 机 制 就 是 如 此 规定 的 ， 所 以 
我 们 也 没有 什么 好 办 法 。 邦 外 ， 如 采 减 少 禾 的 容量 ， 磁 盘 访 问 次 数 驶 会 
增加 ， 就 会 导致 谈 写 文件 的 时 间 变 长 。 由 于 在 磁盘 表面 上 ， 表 示 朵 区 区 
分 的 领域 是 必要 的 ， 因 此 ， 如 果 簇 的 容量 过 小 ， 磁 盘 的 整体 容量 也 会 减 
少 。 届 区 和 艇 的 大 小 ， 是 由 处 理 速度 和 存储 容量 的 平衡 来 决定 的 。 


阅读 本 章 后 ， 关 于 内 存 和 磁盘 的 亲密 关系 ， 大 家 应 该 都 清楚 了 吧 。 
时 然 现 在 计算 机 中 的 内 存 和 人 磁盘 容量 变 得 越 来 越 大 ， 不 过 还 是 要 有 市 
约 的 精神 。 一 个 优秀 的 程序 ， 不 仅 要 运行 速度 快 ， 还 要 小 。 因 此 ， 程 
序 员 要 时 刻 注意 尽量 让 程序 小 一 些 。 


下 一 章 ， 我 们 将 会 介绍 图 像 文件 的 数据 形式 及 文件 的 压缩 机 制 。 
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9 类 | 身 | 问 | 答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


1. 文件 储存 的 基本 单位 是 什么 ? 

2. DOC、LZH 和 TXT 这 些 扩展 名 中 ， 哪 一 个 是 压缩 文件 的 扩 
展 名 ? 

3. 文件 内 容 用 “数据 的 值 x 循环 次 数 ” 来 表示 的 压缩 方法 是 
RLE 算法 还 是 哈 夫 曼 算 法 ? 

4. 在 Windows 计算 机 经 常 使 用 的 SHIFT JIS 字符 编码 中 ，1 
个 半角 英 数 是 用 几 个 字 节 的 数据 来 表示 的 ? 

5. BMP( BITMAP ) 格式 的 图 像 文件 ， 是 压缩 过 的 吗 ? 

6. 可 他 压 缩 和 非 可 侯 压 缩 的 不 同 点 是 什么 ? 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


1 字 节 (=8 位 ) 
LZH 


. RLE 算法 

. 1 字 廊 (=8 位 ) 

. 没有 压缩 过 

. 压缩 后 的 数据 能 复原 的 是 可 逆 压 缩 ， 无 法 复原 的 是 非 可 逆 压 缩 


. 文件 是 学 市 数据 的 集合 体 。 

. LZH 是 用 LHA 等 工具 压缩 过 的 文件 的 扩展 名 。 

.例如 ，AAABB 这 个 数据 压缩 后 就 是 A3B2。 

. 半角 英文 数字 是 用 1 个 字 市 来 表示 的 ， 汉 字 每 全 角 字 符 是 用 两 


个 字 节 来 表示 的 。 


. 因为 BMP 格式 的 图 像 文 件 是 没有 被 压缩 的 ， 因 此 要 比 JPEG 格 


式 等 压缩 过 的 网 像 文件 大 不 少 。 


. 像 照片 (JPEG 格式 ) 这 样 ， 之 所 以 压缩 后 也 不 会 让 人 感到 不 目 


然 ， 就 是 因为 使 用 了 非 可 逆 奈 缩 。 
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前 几 章 的 内 容 可 能 有 些 难 ， 而 本 章 我 们 就 可 以 阿 
口气 喝 喝 茶 了 ， 请 大 家 放松 心情 来 阅读 。 本 章 的 主题 


是 文件 的 压缩 。 


各 位 读者 想必 都 使 用 过 压缩 文件 吧 。 压 缩 文 件 的 扩展 名 有 LZH 和 
ZIP 等。 比如， 文件 太 大 无 法 放 入 软盘 保存 时 ， 或 将 大 附件 添加 到 电 
子 邮 箱 时 ， 相 信 大 家 都 会 采用 压缩 文件 的 方法 。 此 外 ， 当 我 们 把 数码 
相机 拍摄 的 照片 保存 到 计算 机 上 时 ， 可 能 也 会 在 不 知 不 觉 中 使 用 JPEG 
等 压缩 格式 。 那 么 ， 为 什么 文件 可 以 压缩 呢 ? 想 想 真 是 不 可 思议 。 接 
下 来 就 让 我 们 一 起 来 看 看 文件 的 压缩 机 制 吧 。 


国 6.1 文件 以 字 节 为 单位 保存 

在 解说 文件 的 压缩 机 制 之 前 ， 我 们 首先 来 了 解 一 下 保存 在 文件 中 
的 数据 形式 。 文 件 是 将 数据 存储 在 磁盘 等 存储 媒介 中 的 一 种 形式 。 程 序 
文件 中 存储 数据 的 单位 是 字 节 。 文 件 的 大 小 之 所 以 用 x xKB、x xMB 
等 来 表示 ， 就 是 因为 文件 是 以 字 节 ( B = Byte ) 为 单位 来 存储 的 。 

文件 就 是 字 节 数据 的 集合 。 用 1 字 节 (= 8 位 ) 表示 的 字 节 数据 有 
256 种 ， 用 二 进 制 数 来 表示 的 话 ， 其 范围 就 是 00000000~11111111。 如 
果 文 件 中 存储 的 数据 是 文字 ， 那 么 该 文件 就 是 文本 文件 。 如 果 是 图 形 ， 


(D LZH 是 用 LHA 等 工具 压缩 过 的 文件 的 扩展 名 。 该 压缩 格式 有 时 也 称 为 
LZH 格式 。 

@) ZIP 是 用 PKZIP 等 工具 压缩 过 的 文件 的 扩展 名 。 该 压缩 格式 有 时 也 称 为 
ZIP 格式 。 

(3) 正如 本 书 第 5 章 所 述 ， 从 物理 上 对 磁盘 进行 读 写 时 是 以 户 区 (512 字 节 ) 为 
单位 的 。 但 另 一 方面 ， 程 序 则 可 以 在 逻辑 上 以 字 节 为 单位 对 文件 的 内 容 进 


行 读 写 。 
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那么 该 文件 就 是 图 像 文 件 。 在 任何 情况 下 ， 文 件 中 的 季节 数据 部 是 连 
续 存 储 的 ， 大 家 一 定 要 认识 到 这 一 点 (图 6-1 )。 


Se ef 


UOMONE ON 


尔 S J 
en 01010011 
了 局 ! 


感谢 您 阅读 本 书 


图 像 文件 


0011101| |00001101| 
[00000011| 


图 6-1 文件 是 字 节 数据 的 集合 体 


6.2 RLE 算法 的 机 制 

接 下 来 就 让 我 们 正式 看 一 下 文件 的 压缩 机 制 。 首 先 让 我 们 来 尝试 
一 下 对 存储 着 AAAAAABBCDDEEEEEF 这 17 个 半角 字符 的 文件 ( 文 
本 文件 ) 进行 压缩 。 虽 然 这 些 文字 没有 什么 实际 意义 ， 但 是 很 适合 用 来 
解说 RLE 算法 的 压缩 机 制 。 


由 于 半角 字母 中 ，1 个 字符 是 作为 1 个 字 市 的 数据 被 保存 在 文件 中 
的 。 因 此 上 述 文件 的 大 小 就 是 17 个 字 节 。 那 么 如 何 才能 压缩 该 文件 
呢 ? 大 家 也 不 妨 考虑 一 下 。 只 要 能 使 文件 小 于 17 字 节 ， 我 们 可 以 使 用 
任何 压缩 方法 。 


这 时 ， 大 家 是 不 是 会 采取 将 文件 的 内 容 用 “字符 x 重复 次 数 ” 这 
样 的 表现 方式 来 压缩 呢 。 确 实 ， 在 观察 AAAAAABBCDDEEEEEF 这 个 
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数据 后 ， 不 难看 出 有 不 少 字 符 是 重复 出 现 的 。 在 字符 后 面 加 上 重复 
出 现 次 数 ，AAAAAABBCDDEEEEEF 就 可 以 用 A6B2C1D2E5F1 来 
表示 。A6B2C1D2E5F1 是 12 个 字符 也 就 是 12 字 方 ， 因 此 结 采 就 将 原 
文件 压缩 了 12 字 节 :17 字 节 导 70%。 茶 喜 你 ， 压 缩 成 功 了 1! 


像 这 样 ， 把 文件 内 容 用 “数据 x 重复 次 数 ” 的 形式 来 表示 的 压缩 方 
法 称 为 RLE ( Run Length Encoding， 行 程 长 度 编码 ) 算法 (图 6-2), RLE 
算法 是 一 种 很 好 的 压缩 方法 ， 经 常 被 用 于 压缩 传真 的 图 像 等 “。 因 为 图 
像 文件 本 质 上 也 是 字 节 数据 的 集合 体 ， 所 以 可 以 用 RLE 算法 来 压缩 。 


压缩 前 的 文件 压缩 后 的 文件 
AAAAAABBCDDEE 压缩 


FFFF ce ee 


17 个 文字 (17 宇 池 12 


人 


6.3 RLE 算法 的 缺点 

然而 ， 在 实际 的 文本 文件 中 ， 同 样 字符 多 次 重复 出 现 的 情况 并 不 
多 见 。 虽 然 针 对 相同 数据 经 常 连续 出 现 的 图 像 、 文 件 等 ，RLE 算法 可 
以 发 挥 不 错 的 效果 ， 但 它 并 不 适合 文本 文件 的 压缩 。 不 过 ， 因 为 该 压 


(DD RLE 算法 经 常 被 用 于 传真 FAX 等 。G3 类 传真 机 是 把 文字 和 图 形 都 作为 黑 
白 图 像 来 发 送 的 。 由 于 黑白 图 像 的 数据 中 ， 和 白 或 黑 通 常 是 部 分 连续 的 ， 因 
此 就 没有 必要 再 发 送 这 部 分 数据 的 值 ( 白 或 者 黑 )， 而 只 需 附 种 上 重复 次 数 
即 可 ， 这 样 压缩 效率 就 得 到 了 大 幅 提 升 。 例 如 ， 像 白色 部 分 重复 5 次 ， 黑 
色 部 分 重复 7 次， 白色 部 分 重复 4 次 ， 黑 色 部 分 重复 6 次 这 样 的 部 分 图 像 ， 
就 可 以 用 5746 这 样 的 重复 次 数 数字 来 进行 压缩 。 
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缩 机 制 非常 简单 ， 因 此 使 用 RLE 算法 的 程序 也 相对 更 容易 编写 。 笔 者 
曾 用 自己 做 成 的 RLE 算法 压缩 程序 对 各 种 类 型 的 文件 进行 过 压缩 ， 其 
结果 如 表 6-1 所 示 。 


表 6-1 借助 RLE 算法 对 各 文件 进行 压缩 的 结果 


文件 类 型 压缩 前 文件 大 小 压缩 后 文件 大 小 压缩 比率 
ES 14862 5 29506 = 199% 
图 像 文件 96062 字 节 S202 40% 
EXE 文件 A457 Leslee 62°5 


通过 表 6-1 可 以 看 出 ,使 用 RLE 算法 对 文本 文件 进行 压缩 后 ， 文 
件 却 增 大 了 ， 而 且 几 乎 是 压缩 前 的 2 倍 。 这 是 因为 文本 文件 中 同样 字 
符 连 续 出 现 的 部 分 并 不 多 。 以 存储 着 “This is a pen.” 这 14 个 字符 的 文本 
文件 为 例 ， 使 用 RLE 算法 对 其 进行 压缩 后 ， 束 变 成 了 “Tlhlilsl lilsl 
lal lplelnl.1” 这 样 的 28 个 字符 ， 是 压缩 前 的 2 倍 。 由 于 文 草 中 字符 大 
量 连 续 出 现 的 情况 并 不 多 见 ， 因 此 ， 使 用 RLE 算法 后 ， 大 部 分 字符 后 面 
都 会 加 上 1， 这 样 一 来 ， 压 缩 后 的 文件 自然 变 成 了 之 前 的 2 倍 。 


与 文本 文件 不 同 , 图 像 文 件 的 压缩 比率 ”达到 了 40%。 程 序 的 EXE 
文件 的 压缩 比率 也 达到 了 60%， 这 是 因为 EXE 文件 中 连续 的 数据 部 
分 ， 其 初始 值 为 0 的 情况 很 多 。 


此 外 ， 我 们 也 可 以 在 RLE 算法 的 基础 上 再 下 点 功夫 ， 不 以 1 个 字 
符 为 单位 ， 而 以 字符 串 为 单位 来 查找 重复 次 数 。 例 如 ，This is a pen. 
中 ,is 重复 了 两 次 。 通 过 利用 这 个 压缩 技巧 ， 压 缩 后 的 文件 也 能 小 一 
些 。 由 此 可 见 ， 压 缩 技 巧 的 拙劣 是 由 所 花 的 功夫 决定 的 。 


山 压缩 后 同 压缩 前 文件 大 小 的 比率 ， 称 为 压缩 比率 或 压缩 比 。 
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团 6.4 通过 莫 尔 斯 编码 来 看 哈 夫 曼 算法 的 基础 

压缩 技巧 实际 上 有 很 多 种 。 接 下 来 ， 我 们 就 来 看 一 下 本 章 要 介绍 
的 第 二 个 压缩 技巧 ， 即 哈 夫 曼 算 法 。 哈 夫 曼 算 法 是 哈 夫 曼 
(D.A. Huffman ) 于 1952 年 提出 来 的 压缩 算法 。 日 本 人 比较 常用 的 压缩 
软件 LHA ， 使 用 的 就 是 哈 夫 曼 算 法 。 


为 了 更 好 地 理解 喻 夫 曙 算法， 首先 大 家 要 抛弃 挥 “半角 喘 文 数字 的 
1 个 字符 是 1 个 字 市 (8 位 ) 的 数据 ”这 一 概念 。 文 本 文件 是 由 不 同类 
型 的 字符 组 合 而 成 的 ， 而 且 不 同 的 字符 出 现 的 次 数 也 是 不 同 的 。 例 
如 ， 在 某 一 个 文本 文件 中 ，A 出 现 了 100 次 左右 ，Q 仅 用 到 了 3 次 ， 
类 似 这 样 的 情况 是 很 常见 的 。 而 哈 夫 曼 算 法 的 关键 就 在 于 “多 次 出 现 
的 数据 用 小 于 8 位 的 字 万 数 来 表示 ， 不 稼 用 的 数据 则 可 以 用 超过 8 位 
的 字 节 数 来 表示 ”。A 和 Q 都 用 8 位 来 表示 时 ， 原 文件 的 大 小 就 是 
100 次 x8g 位 +3 次 x8g 位 =824 位 ， 而 假设 A 用 2 位 、Q 用 10 位 来 
表示 ， 压 缩 后 的 大 小 就 是 100 次 x2 位 +3 次 x10 位 =230 位 。 


不 过 有 一 点 需要 注意 ， 不 管 是 不 满 8 位 的 数据 ， 还 是 超过 8 位 的 
数据 ， 最 终 部 要 以 8 位 为 单位 保存 到 文件 中 。 这 是 因为 磁盘 是 以 字 
三 (8 位 ) 为 单位 来 保存 数据 的 (图 6-3 )。 为 了 实现 这 一 处 理 ， 压 颖 
程序 的 内 容 会 复杂 很 多 ， 不 过 作为 回报 ， 最 终 得 到 的 压缩 率 也 是 相 
当 高 的 。 


下 面 让 我 们 把 当前 的 话题 暂时 放下 ， 为 了 更 好 地 理解 哈 夫 受 算 法 ， 先 
来 看 一 下 英 尔 斯 编码 。 葛 尔 斯 编码 是 1837 年 英 尔 斯 ( Samuel F B. Morse ) 
提出 的 。 疯 尔 斯 编码 不 是 通过 语言 ， 而 是 通过 “ 哄 跑 哄 跑 ” 这 些 长 点 


(DD LHA 是 吉 周 荣 泰 开发 的 一 款 免费 压缩 软件 。 
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和 短 点 的 组 合 来 传递 文本 信息 的 。 想 必 大 家 在 电影 中 也 都 看 到 过 发 送 
更 尔 斯 电码 的 设备 。 


2 位 2 位 Bl 4 位 
Wonon Wo 


LL AN 


| | DB 
Wi oo 中 Ql 
ul 保存 在 文件 中 


图 6-3 非 8 位 数据 的 读 写 | 


接 下 来 我 们 就 来 仔细 讲解 一 下 更 尔 斯 编 权 。 对 数字 领域 比较 名 


的 读者 可 能 会 认为 “更 尔 斯 编码 的 短 点 是 0， 长 点 是 1， 其 中 1 个 字符 
用 8 位 来 表示 ”， 但 实际 上 ， 根 据 字符 种 炎 的 不 同 ， 莫 尔 斯 电码 符号 的 
长 度 也 是 不 同 的 。 表 6-2 是 更 尔 斯 编码 的 示例 。 大 家 把 1 看 作 是 短 点 


( 咬 )， 把 11 看 作 是 长 点 ( 啥 ) 即 可 。 


加 四 让 


7 


汪 所 


表 6-2 莫 尔 斯 编码 和 位 长 


说 对 应 的 位 数据 位 长 


O00 4 位 
B00@00 O00 8 位 
加 一 0 依 0 0 仿 9 位 


M00@°0 Gf 
0 1 位 
@0 人 0 国 1o 人 8 位 
符 间隔 0 0 2 


@. 短 点 、 国 四 : 长 点 、0: 短 点 和 长 点 的 分 隔 符 


更 尔 斯 编码 把 一 般 文 本 中 出 现 频率 高 的 字符 用 短 编码 来 表示 。 这 
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里 所 说 的 出 现 频率 ， 不 是 通过 对 出 版 物 等 文章 进行 统计 调查 得 来 的 ， 
而 是 根据 印刷 行业 的 印刷 活字 数目 而 确定 的 。 如 表 6-2 所 示 ， 假 设 表 示 
短 点 的 位 是 1， 表示 长 点 的 位 是 11 的 话 ， 那 么 E( 咬 ) 这 一 字符 的 数据 
就 可 以 用 1 位 的 1 来 表示 ,，C ( 噶 咬 蜡 喃 ) 这 一 字符 的 数据 就 可 以 用 9 位 
的 110101101 来 表示 。 在 实际 的 莫 尔 斯 编码 中 ， 如 果 短 点 的 长 度 是 1， 
长 点 的 长 度 就 是 3， 短 点 和 长 点 的 间隔 就 是 1。 这 里 的 长 度 指 的 是 声 
音 的 长 度 。 接 下 来 ， 就 让 我 们 营 试 一 下 用 莫 尔 斯 编码 来 表示 前 面 提 到 
的 AAAAAABBCDDEEEEEF 这 个 17 个 字符 的 文本 。 在 莫 尔 斯 编码 
中 ， 各 个 字符 之 间 需 要 加 入 表示 间隔 的 符号 。 这 里 我 们 用 00 来 进行 
区 分 。 因 此 ，AAAAAABBCDDEEEEEF 这 个 文本 ， 就 变 成 了 Ax6 次 
+Bx2 次 +Cx1l 次 +Dx2 次 +ExS$ 次 +Fx1 次 + 字符 间隔 x 16 = 
4 位 x6 次 +8 位 x2 次 +9 位 x1 次 +6 位 x2 次 +1 位 x5 次 +8 位 
x1 次 +2 位 x16 次 =106 位 与 14 字 节 。 因 为 文件 只 能 以 字 节 为 单 
位 来 存储 数据 ， 因 此 不 满 1 字 节 的 部 分 就 要 圆 整 成 1 个 字 节 。 如 有 果 所 
有 字符 占用 的 空间 都 是 1 个 字 节 (8 位 )， 这 样 文本 中 列 出 来 的 17 个 
字符 = 17 字 节 ， 那 么 摩尔 斯 电码 的 压缩 比率 就 是 14:17 与 82%， 并 
不 太 突 出 。 


团 6.5 用 二 又 树 实现 哈 夫 曼 编码 

刚才 已 经 提 到 ， 间 尔 斯 编码 是 根据 日 常 文本 中 各 字符 的 出 现 频率 
来 决定 表示 各 字符 的 编码 的 数据 长 度 的 。 不 过 ， 该 编码 体系 ， 对 
AAAAAABBCDDEEEEEF 这 样 的 特殊 文本 并 不 是 最 适合 的 。 在 真 尔 斯 
编码 中 ，E 的 数据 长 度 最 短 ， 而 在 AAAAAABBCDDEEEEEF 这 个 文本 
中 ， 出 现 最 频繁 的 是 字符 A。 因 此 ， 应 该 给 A 分 配 数据 长 度 最 短 的 编 
码 。 这 样 做 才 会 使 压缩 率 更 高 。 
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下 面 我 们 来 看 一 下 哈 夫 曼 算 法 。 哈 夫 曼 算 法 是 指 ， 为 各 压缩 对 象 
文件 分 别 构造 最 佳 的 编码 体系 ， 并 以 该 编码 体系 为 基础 来 进行 压缩 。 
因此 ， 用 什么 样式 的 编码 ( 哈 夫 受 编码 ) 对 数据 进行 分 割 ， 就 要 由 各 个 
文件 而 定 。 用 哈 夫 曼 算 法 压缩 过 的 文件 中 ， 存 储 着 哈 夫 曼 编码 信息 和 
压缩 过 的 数据 ( 图 6-4 )。 


压缩 前 的 文件 压缩 后 的 文件 


一 信 


哈 夫 曼 编码 的 信息 
压缩 后 的 数据 


图 6-4 用 哈 夫 曼 算法 压缩 的 文件 的 构造 


接 下 来 ， 我 们 尝试 一 下 把 AAAAAABBCDDEEEEEF 中 的 A~F 这 
些 字 符 ， 按 照 “ 出 现 频率 高 的 字符 用 尽量 少 的 位 数 编码 来 表示 ”这 一 原 
则 进行 整理 。 按 照 出 现 频率 从 高 到 低 的 顺序 整理 后 ， 绪 来 就 如 表 6-3 所 
示 。 该 表 中 同时 也 列 出 了 编码 的 方案 。 


表 6-3 ”出现 频率 和 编码 ( 方案 ) 


字符 出 现 频率 编码 ( 方案 ) 位 数 
A 6 0 1 
E 5 1 1 
B 2 10 2 
D 2 让 
C 1 100 3 
E 1 101 @ 


在 表 6-3 的 编码 (方案 ) 中 ， 随 着 出 现 频率 的 降低 ， 字 符 编码 信息 
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的 数据 位 数 也 在 逐渐 增加 ， 从 开始 的 1 位 、2 位 ， 依 次 增加 到 3 位 。 不 
过 ， 这 个 编码 体系 是 存在 问题 的 。 该 问题 就 是 ， 例 如 100 这 个 3 位 的 


编码 ， 它 的 意思 是 用 1、0、0 这 3 个 编码 来 表示 了 E、A、A 呢 ? 还 是 用 
10、0 这 两 个 编码 来 表示 B 、A 呢 ? 亦 或 是 用 100 来 表示 C 呢 ? 这 些 
都 无 法 进行 区 分 。 因 此 ， 如 果 不 加 入 用 来 区 分 字符 的 符号 ， 这 个 编码 
(方案 ) 就 无 法 使 用 。 


而 在 喻 夫 曼 算法 中 ， 通 过 借助 哈 夫 曼 树 构造 编码 体系 ， 即 使 在 不 
使 用 字符 区 分 符号 的 情况 下 ， 也 可 以 构建 能 够 明确 进行 区 分 的 编码 体 
系 。 也 就 是 说 ， 利 用 哈 夫 曼 树 后 ， 就 算 表 示 各 字符 的 数据 位 数 不 同 ， 
也 能 够 做 成 可 以 明确 区 分 的 编码 。 因 此 ， 只 要 掌握 了 哈 夫 受 树 的 制作 
方法 ， 并 用 程序 将 其 完成 ， 就 可 以 借助 哈 夫 曼 算法 实现 文件 压缩 了 。 
不 过 ， 与 RLE 算法 相 比 ， 程 序 的 内 容 要 复杂 很 多 。 


接 下 来 我 们 就 来 看 一 下 如 何 制作 哈 夫 曼 树 。 目 然 界 的 树 是 从 根 开 
始 生 枝 长 叶 的 。 而 哈 夫 曼 树 则 是 从 叶 生 校 ， 然 后 再 生根 。 图 6-5 展示 
了 对 AAAAAABBCDDEEEEEF 进行 编码 的 哈 夫 曼 树 的 制作 过 程 。 大 
家 也 尝试 绘制 一 下 吧 。 尝 试 过 1 次 后 ， 应 该 就 能 理解 哈 夫 曼 树 的 制作 
顺序 了 。 
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: 列 出 数据 及 其 出 现 频 率 ，( ) 里 面 表示 的 是 出 现 频率 ， 
这 里 按照 降序 排列 

出 现 频 率 (6) 

数据 a 


: 选择 两 个 出 现 频率 最 小 的 数字 ， 拉 出 两 条 线 ， 并 在 交叉 地 方 
写 上 这 两 位 数字 的 和 。 当 有 多 个 选项 时 ， 任 意 选 取 即 可 


出 现 频率 
数据 


重复 步骤 2， 可 以 连接 任何 位 置 的 数值 


出 现 频率 
数据 


: 最 后 这 些 数字 会 被 汇集 到 了 1 个 点 上 ， 该 点 就 是 根 ， 这 样 哈 夫 
曼 树 也 就 完成 了 。 按 照 从 根部 到 底部 的 叶子 这 一 顺序 ， 在 左边 
的 树枝 ( 线 ) 处 写 上 0， 在 右边 的 树枝 ( 线 ) 处 写 上 1。 然 后 从 
根部 开始 沿 着 树枝 到 达 目 标 文字 后 ， 再 按照 顺序 把 通过 的 树枝 
上 的 0 或 者 1 写 下 来 ， 就 可 以 得 到 哈 夫 曼 编 码 了 

的 区 全 


i 
0 
出 现 频率 (6) (5) (2) (2) 


数据 A EB DC 
哈 夫 曼 编 码 00 01 100 101 110 111 


图 6-5 哈 夫 曼 树 的 编码 顺序 
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6.6” 哈 夫 曼 算法 能 够 大 幅 提 升 压缩 比率 
使 用 哈 夫 曼 树 后 ， 出 现 频 率 越 高 的 数据 所 占用 的 数据 位 数 就 越 少 ， 
而 且 数 据 的 区 分 也 可 以 很 清晰 地 实现 。 但 哈 夫 曼 算 法 为 什么 达到 这 人 么 
好 的 效果 呢 ， 大 家 都 了 解 吗 ? 

通过 图 6-5 的 步骤 2 可 以 发 现 ， 在 用 术 条 连接 数据 时 ， 我 们 是 从 出 
现 频率 较 低 的 数据 开始 的 ， 这 就 意味 着 出 现 频率 越 低 的 数据 到 达 根 部 
的 校 条 数 就 越 多 。 而 术 条 数 越 多 ， 编 但 的 位 数 也 就 随 之 增多 了 。 

而 从 用 哈 夫 曼 算法 压缩 过 的 文件 中 恋 取 数据 后 ， 就 会 以 位 为 单位 
对 该 数据 进行 排查 ， 并 与 哈 夫 曼 树 进行 比较 看 是 否 到 达 了 目标 编码 ， 
这 就 是 为 什么 哈 夫 曼 算 法 可 以 对 数据 进行 区 分 的 原因 。 例 如 ，10001 这 
个 使 用 图 6-5 所 示 的 哈 夫 曼 编码 作成 的 $ 位 数据 ， 到 达 100 时 ， 对 照 哈 
夫 曼 树 的 数据 ， 该 数据 表示 的 是 B 这 个 字符 。 至 此 就 找到 了 1 个 字符 。 
然后 再 顺 着 哈 夫 曼 树 寻 找 剩 下 的 01， 会 发 现 它 表示 的 是 E 这 个 字符 。 

接 下 来 ， 让 我 们 来 看 一 下 哈 夫 曼 算 法 的 压缩 比率 。 用 图 6-5 得 到 的 
哈 夫 曼 编 码 表示 AAAAAABBCDDEEEEEF， 结 果 为 00000000000010010 
01101011010101010101111，40 位 = $ 字 市 (这 里 为 不 包含 哈 夫 曼 编码 信 
县 的 情况 ) 压缩 前 的 数据 是 17 字符 = 17 字 节 ， 也 就 是 说 ， 我 们 惊奇 
地 得 到 了 5 字 节 + 17 字 闻 二 29% 这 样 高 的 压缩 率 。 表 6-4 是 将 表 6-1 
中 的 文件 应 用 哈 夫 曼 算 法 的 LHA 进行 压缩 后 的 结果 ， 大 家 可 以 参考 一 
下 。 可 以 看 出 ， 不 管 是 哪 种 类 型 的 文件 ， 都 得 到 了 很 高 的 压缩 比率 。 
表 6-4 LHA 对 各 种 文件 的 压缩 结果 


文件 类 型 压缩 前 压缩 后 压缩 比率 
Dee 14.862 字 证 A 28% 
图 像 文 件 96 062 字 节 5 oe 
EXE 文件 2205 7 2 4652 字 19% 
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转 6.7 可 逆 压 缩 和 非 可 逆 压 缩 

最 后 ， 让 我 们 来 看 一 下 图 像 文件 的 数据 形式 。 图 像 文件 的 使 用 目的 通 
常 是 把 图 像 数据 输出 到 显示 器 、 打 印 机 等 设备 上 。Windows 的 标准 图 像 数 
据 形 式 为 BMP ， 是 完全 未 压缩 的 。 由 于 显示 器 及 打印 机 输出 的 bit (点 ) 
是 可 以 直接 映射 ( mapping ) 的 ， 因 此 便 有 了 BMP = bitmap 这 一 名 称 。 


除 BMP 格式 以 外 ， 还 有 其 他 各 种 格式 的 图 像 数据 形式 。 比 如 
JPEG 格式 、TIFF 格式 、GIF 格式 等 。 与 BMP 格式 不 同 的 是 ， 这 些 
图 像 数据 都 会 用 一 些 技法 来 对 数据 进行 压缩 。 


图 像 文件 还 可 以 使 用 与 前 文 介绍 的 RLE 算法 、 喻 夫 曼 算法 不 同 的 
其 他 压缩 算法 。 这 是 因 为 ， 多 数 情况 下 ， 并 不 要 求 压 缩 后 的 图 像 文件 
必须 还 原 到 与 压缩 前 同等 的 质量 。 与 之 相 比 ， 程 序 的 EXE 文件 以 及 每 
个 字符 、 数 值 都 有 具体 含义 的 文本 文件 则 必须 要 还 原 到 和 压缩 前 同样 
的 内 容 。 而 对 于 图 像 文件 来 说 ， 即 使 有 时 无 法 还 原 到 压缩 前 那样 鲜明 
的 图 像 状 态 , 但 只 要 肉眼 看 不 出 什么 区 别 ， 有 一 些 模糊 也 勉强 可 以 接受 。 
这 里 ， 我 们 把 能 还 原 到 压缩 前 状态 的 压缩 称 为 可 逆 压 缩 ， 无 法 还 原 到 压 
缩 前 状态 的 压缩 称 为 非 可 逆 压 缩 ， 这 一 点 布 望 大 家 记 住 ( 图 6-6 )。 


QD BMP (Bitmap ) 是 使 用 Windows 自 带 的 画笔 来 做 成 的 一 种 图 像 数 据 形 式 。 

(2 JPEG (Joint Photographic Experts Group ) 是 数码 相机 等 常用 的 一 种 图 像 数 
据 形 式 。 

(3) TIFF (Tag Image File Format ) 是 一 种 通过 在 文件 头 中 包含 “标签 ”就 能 够 
显示 出 数据 性 质 的 图 像 数据 形式 。 

由 GIF (Graphics Interchange Format ) 是 由 美国 CompuServe 开发 的 一 种 数据 
格式 。 这 种 格式 要 求 色 数 不 超过 256 色 。 
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( a ) 可 逆 压 缩 
压缩 前 的 文件 
|| 


压缩 后 的 文件 
还 原 后 的 文件 


( pb ) 非 可 逆 压 缩 


压缩 前 的 文件 
压缩 后 的 文件 


图 6-6 ”图像 文件 的 压缩 有 可 逆 压 缩 和 不 可 逆 压 缩 两 种 


ad 原始 的 图 像 文件 是 
BMP 格式 。 通 过 此 图 可 以 看 出 ，JPEG 格式 和 GIF 格式 的 图 像 文件 有 
一 些 模糊 。 We 因此 还 原 后 的 


QD 数码 相机 中 经 常用 到 的 JPEG 格式 文件 ， 有 3 种 压缩 方式 。 
(1 ) 把 构成 图 像 的 点 阵 的 颜色 信息 由 RGB ( 红色、 绿色 、 蓝 色 ) 形式 转化 
成 YCbCr ( 亮度 、 蓝 色色 度 、 红 色色 度 ) 形式 。 我 们 知道 ， 人 了 眼 对 亮度 很 
敏感 ， 但 对 颜色 的 变化 却 有 些 迟 钝 。 因 此 ， 人 眼 比 较 敏 感 的 亮度 了 就 是 一 
个 很 重要 的 参数 ， 而 表示 颜色 的 Cb、Cr 则 没有 那么 重要 。 于 是 我 们 就 可 
以 通过 减少 Cb 和 Cr 的 信息 间距 来 缩小 图 像 数 据 的 大 小 。 
(2 ) 将 每 个 点 的 色素 变化 看 作 是 波形 的 信号 变化 ， 进 行人 埔里 叶 变 换 。 倩 里 叶 变 
换 是 指 将 波形 按照 频率 分 量 进行 分 解 。 照 片 等 图 像 文 件 的 特点 是 低频 率 ( 柔 和 
的 颜色 变化 ) 的 部 分 较 多 ， 高 频率 ( 强烈 的 的 颜色 变化 ) 的 部 分 较 少 。 因 此 ， 这 
里 我 们 就 可 以 把 高 频率 的 部 分 剪 切 掉 。 这 样 一 来 ， 图 像 数据 也 就 会 缩小 。 虽 
en 但 人 上限 分 辩 不 出 什么 差别 。 不 过 ， 如 果 是 用 Windows 

笔 描 绘 的 简单 图 形 ， 其 中 颜色 变化 强烈 的 部 分 就 会 出 现 模糊 现象 。 大 家 不 

Pi 笔 做 一 个 圆 形 或 者 四 方形 的 图 形 ， 并 将 其 保存 成 JPEG 格 
式 。 然 后 再 打开 这 个 JPEG 文件 ， 你 就 会 发 现 颜色 变化 强烈 的 部 分 变 模糊 了 。 
(3 ) 最 后 ， 将 已 经 瘦身 的 图 像 数 据 通 过 哈 夫 曼 算 法 进行 压缩 。 这 样 就 可 以 
使 图 像 数 据 进 一 步 缩 小 。 
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图 像 信息 有 一 部 分 是 模糊 的 。 而 GIF 格式 的 文件 虽然 是 可 逆 压 缩 ， 但 
因为 有 色 数 不 能 超过 256 色 的 限制 ， 所 以 还 原 后 颜色 信息 会 有 一 些 缺 
失 ， 进 而 导致 了 图 像 模 糊 。TIFF 格式 的 图 像 文件 虽然 不 模糊 ， 但 却 比 
原始 的 BMP 格式 的 文件 还 要 大 ， 这 是 为 什么 呢 ? 我 们 知道 ，TIFF 格 
式 的 文件 中 带 有 各 种 标签 信息 ， 是 可 以 选择 压缩 格式 的 ， 而 这 里 选择 
的 是 与 BMP 同样 的 无 压缩 方式 。 但 由 于 与 原始 的 图 像 数据 相 比 ，TIFF 
格式 的 文件 中 附加 了 标签 信息 ， 所 以 结果 就 比 BMP 格式 的 文件 更 大 了 。 


BMP 形式 
005) 


JPEG 形式 
eeoa 于 | 


TIFF 形式 
人 25 


GIF 形式 
(2050 1 


6-7 ”各 种 形式 的 图 像 文 件 的 画 质 对 比 
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压缩 算法 的 种 类 大 概 有 一 二 十 种 。 之 所 以 会 存在 如 此 多 的 压缩 算 
法 ， 是 因为 压缩 比率 、 压 缩 需要 的 处 理 时 间 (程序 的 复杂 程度 ) 以 及 各 


种 文件 的 需求 等 是 不 一 样 的 。 因 此 ， 至 今 学 界 都 不 能 提出 一 个 万 能 的 
压缩 算法 。 而 这 也 为 各 位 读者 提供 了 一 个 展露 才能 的 机 会 。 大 家 不 妨 
符 试 一 下 ， 目 己 原 创 一 个 压缩 算法 。 不 过 有 一 点 需要 注意 ,文本 文件 
不 能 进行 非 可 逆 压 缩 。 至 于 原因 ， 想 必 大 家 也 虱 清 楚 了 吧 。 


接 下 来 的 一 革 ， 我 们 将 会 返回 到 本 书 的 主题 ， 对 程序 的 运行 环境 
进行 说 明 。 
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如 果 是 你 ， 
你 会 怎样 介绍 ? 


向 沉迷 游戏 的 中 学 生 讲解 内 存 和 磁盘 


笔者 : 你 现在 最 想 要 的 东西 是 什么 ? 
中 学 生 : 现在 ”游戏 机 顺 。 

笔者 : 那 你 都 有 什么 游戏 机 啊 ? 

中 学 生 : 任天堂 DS 和 PlayStation。 
笔者 : ( 太 好 了 1! 这 样 就 可 以 癌 他 
讲解 内 存 和 磁盘 了 ) 嗯 嗯 。 那 么 ， 
任天堂 DS 使 用 的 是 盒 式 人 磁带 ， 
PlayStation 使 用 的 是 CD， 对 吧 。 
磁盘 和 CD 有 什么 不 同 呢 ? 

中 学 生 : CD 可 以 存放 大 量 的 数据 ， 
男 外 图 像 和 声音 也 很 有 冲击 力 啊 。 
笔者 : 说 得 对 ! 说 得 对 ! 你 知道 
吗 ， 任 天 党 DS 和 PlayStation 都 是 
计算 机 的 一 种 。 计 算 机 不 仅 可 以 玩 
游戏 ， 也 可 以 进行 文档 处 理 和 上 网 ， 
所 以 说 任天堂 DS 和 PlayStation 吕 ® 
是 游戏 专用 的 计算 机 。 

中 学 生 : 这 个 我 也 知道 啊 。 

笔者 : 计算 机 是 运行 软件 的 机 械 设 
备 ， 这 些 软件 可 以 放 在 磁盘 及 CD 
中 ， 这 些 你 知道 吧 ? 

中 学 生 : 当然 知道 了 。 


笔者 : CD 就 像 唱片 一 样 ， 是 通过 
表面 的 凹凸 来 存储 软件 的 ， 这 一 
点 想必 你 也 知道 吧 。 那 么 盒 式 磁 
带 中 是 什么 样子 你 知道 吗 ? 

中 学 生 : 简单 啊 。 里 面 有 内 存 啊 。 
笔者 : 了 不 起 ! 答对 了 ! 那 你 知道 
内 存 是 如 何 存储 软件 的 吗 ? 

中 学 生 .， or 

笔者 : 是 通过 电流 的 有 无 来 存储 
的 。 你 可 以 这 样 理解 ， 有 电流 时 
是 凸 ， 无 电流 时 是 凹 。 

中 学 生 : 那么 ， 为 什么 CD 能 存储 
更 多 的 数据 呢 ? 

笔者 : ( 唉 ， 这 还 真是 个 难题 …… 
怎么 回答 好 呢 …… 有 了 ! ) 盒 式 磁 
带 使 用 大 量 内 存 的 话 也 可 以 放 入 
大 量 数据 啊 。 不 过 ， 到 时 候 1 个 
盒 式 磁带 就 要 几 千 元 了 。 

中 学 生 : 几 千 元 ， 买 不 起 啊 。 
笔者 : 对 啊 。 正 是 因为 如 此 ， 数 据 
量 大 的 软件 才 放 在 成 本 较 低 的 CD 
中 进行 存储 。 不 过 ，CD 中 存储 的 
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软件 ， 也 要 复制 到 游戏 机 的 内 存 
中 才能 运行 。 

中 学 生 : 那 不 就 是 说 ， 最 后 还 是 用 
到 了 内 存 吗 ? 

笔者 : 确实 是 这 样 ， 游 戏 机 的 内 
存 ， 只 能 放 入 少量 的 数据 。 因 此 ， 
游戏 机 是 一 边 把 CD 中 存储 的 软件 
部 分 复制 和 内存， 一 边 运 行 游戏 的 。 
中 学 生 : 怪不得 游戏 中 会 出 现 
Loading... 呢 。 原 来 如 此 ， 明 白 了 。 

笔者 : 对 ， 就 是 这 样 ! 正如 刚才 所 
说 的 ， 计 算 机 中 用 来 存储 数据 的 
手段 ， 有 类 似 于 CD 这 样 的 磁盘 和 
内 存 这 两 种 。 而 且 从 现状 来 看 ， 
磁盘 比 内 存 要 便宜 。 

中 学 生 : 那么 ， 所 有 的 游戏 都 放 在 
磁盘 中 的 话 不 也 挺 好 嘛 。 

笔者 : 这 个 提议 虽说 不 错 ， 但 正如 刚 
才 所 说 的 那样 ， 游 戏 要 在 游戏 机 
中 运行 必须 要 复制 到 内 存 中 才 行 。 
中 学 生 : 盒 式 磁 盘 的 数据 也 要 复制 
到 内 存 中 吗 ? 

笔者 : 不 用 。 盒 式 磁带 的 情况 下 ， 
可 以 将 游戏 机 主机 的 内 存 完整 置 
换 ， 所 以 不 需要 往 内 存 中 复制 数 
据 。 只 有 磁盘 才 必 须 把 数据 复制 
到 内 存 中 。 


中 学 生 : 原来 如 此 啊 。 

笔者 : 明白 了 吗 ? 

中 学 生 : 知道 啦 。 

笔者 : 确定 ? 

中 学 生 : 确定 。 我 要 继续 玩 游 戏 
2 

笔者 : 那么 ， 刚 才 玩 游戏 时 的 数 
据 ， 存 储 在 了 什么 地 方 你 知道 吗 ? 
中 学 生 : 这 个 话题 ， 咀 们 就 不 说 
了 吧 。 

笔者 : 喂 ， 等 一 下 ! 

中 学 生 : Byebye ! 


bis 
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9 类 | 身 | 问 | 答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


1. 应 用 的 运行 环境 ， 指 的 是 什么 ? 

2. Macintosh 用 的 操作 系统 ( MacOS ) ,在 AT 兼容 机 上 能 运 
行 吗 ? 

. Windows 上 的 应 用 ， 在 MacOS 上 能 运行 吗 ? 

. FreeBSD 提供 的 Ports， 指 的 是 什么 ? 

. 在 Macintosh 上 可 以 利用 的 Windows 环境 模拟 器 称 为 什么 ? 

. Java 虚拟 机 的 功能 是 什么 ? 


OO) Ol 人 上 QQ@ 
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么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


2 
3. 
4. 通过 使 用 源 代码 来 提供 应 用 ,并 根据 运行 环境 进行 整合 编译 ， 


. 操作 系统 和 计算 机 本 身 ( 硬件 ) 的 种 类 
.无 法 运行 
无 法 运行 


从 而 得 以 在 该 环境 下 运行 的 机 制 


. Virtual PC for Mac 
. 运行 Java 应 用 的 字 节 代码 


. 应 用 的 运行 环境 通常 是 用 类 似 于 Windows(OS) 和 AT 兼容 机 


( 硬件 ) 这 样 的 OS 和 硬件 的 种 类 来 表示 的 。 


. 不 同 的 硬件 种 类 需要 不 同 的 操作 系统 。 
.应 用 是 为 了 在 特定 操作 系统 上 运行 而 作成 的 。 
.FreeBSD 是 一 种 Unix 操作 系统 。 通 过 在 各 个 环境 中 编译 Ports 


中 公开 的 代码 ， 就 可 以 执行 由 此 生成 的 本 地 代码 了 。 


.模拟 需 是 指 在 Macintosh 上 提供 虚拟 的 Windows 环境 。 
.只 要 分 别 为 各 个 环境 安装 专用 的 Java 虚拟 机 ， 同 样 的 字 节 代码 


网 能 在 各 种 环境 下 运行 了 。 
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由 于 同一 个 程序 能 被 大 量 用 户 使 用 ， 所 以 说 程序 
具有 很 大 的 价值 。 如 果 将 程序 拿 来 出 售 的 话 ， 只 要 销 
大 ， 肯 定 就 能 收 到 非常 可 观 的 利润 。 而 即便 是 自由 软件 ( free soft ) ， 

有 大 量 用 户 使 用 的 话 ， 那 也 是 一 件 让 人 高 兴 的 事情 。 大 家 也 都 希 
望 自己 编写 的 程序 被 尽 可 能 多 的 用 户 喜 欢 并 使 用 吧 。 但 是 ， 如 果 运 行 
环境 不 同 ， 程 序 是 无 法 运行 的 。 例 如 ， 在 Macintosh 上 直接 运行 
Windows 用 的 程序 ， 基 本 上 是 无 法 实现 的 。 大 家 都 知道 这 是 因为 运行 
环境 不 同 造 成 的 。 那么 ， 运 行 环境 不 同 指 的 是 什么 呢 ? 为 什么 运行 环 
境 不 同 ， 应 用 就 无 法 运行 呢 ? 本 章 将 对 这 些 问题 进行 解答 ， 并 介绍 多 
个 解决 方法 。 


量 
各 是 


国 7.1 运行 环境 = 操作 系统 + 硬件 


程序 中 包含 者 运 0 Y 用 软 
件 的 话 ， 可 以 稍微 观察 一 下 它 的 安 闭 包 或 者 目录 。 通 稼 在 采 个 位 置 会 
写 有 “运行 环境 ”这 一 项 。 例 如 ，2007 Microsoft Office System (下 文 
简称 为 Office 2007 ) 需要 的 运行 环境 ， 就 如 表 7-1 所 示 。 从 中 可 以 看 
出 ， 在 表示 程序 的 运行 环境 时 ， 列 出 了 Operating System ( 操作 系统 ) 
和 计算 机 的 主机 (硬件 ) 两 项 ， 由 此 ， 大 家 可 以 清楚 地 知道 运行 环境 
是 这 两 者 的 综合 。 也 就 是 说 ， 操 作 系 统 和 人 硬件 决定 了 程序 的 运行 环境 。 


@ 自由 软件 一 般 都 是 免费 的 。 用 户 可 以 从 互联 网 上 下 载 ， 或 者 从 书 、 杂 志 等 
附带 的 D-ROM 中 获取 。 
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表 7-1 2007 Microsoft Office sytem 的 运行 环境 ( 这 里 省 略 了 部 分 内 容 ) 


Microsoft Windows XP Service Pack(SP)2 、 
Windows Server 2003 SP1 及 以 上 版 本 的 操作 系统 


计算 机 和 CPU ( PC/AT 兼容 机 ) ”500MHZ 以 上 的 CPU 
256MB 以 上 的 内 存 ， 需 要 高 速 检索 的 情况 下 ， 推 荐 


日 语 版 操作 系统 


2 使 用 512MB 以 上 的 内 存 

je 2GB 以 上 的 剩余 空间 ， 安装 后 ， 删除 硬盘 上 下 载 的 
安装 包 的 话 ， 会 稍微 释放 出 一 点 空间 

显示 器 1024x768 以 上 的 高 解析 度 显 示 器 

磁盘 设备 CD-ROM 驱动 器 或 者 DVD-ROM 驱动 器 


同一 类 型 的 便 件 可 以 选择 安 效 多 种 操作 系统 。 人 例如， 同样 的 AT 兼 
容 机 ”中 , 既 可 以 安装 Windows, 也 可 以 安装 Linux 等 操作 系统 。 正 因 
为 如 此 ，Office 2007 的 运行 环境 中 ， 把 便 件 和 操作 系统 的 种 类 这 两 方 
面 内 容 都 列 了 出 来 (图 7-1 ),。 不 过 ,Windows 及 Linux 操作 系统 也 存在 
多 种 版 本 。 根 据 应 用 的 具体 情况 ， 有 时 只 有 在 特定 版 本 的 操作 系统 上 
才能 运行 。 

从 程序 的 运行 环境 这 一 角度 来 考量 人 硬件 时 ，CPU 的 种 类 是 特别 重 
要 的 参数 。 为 了 保证 Office 2007 的 正常 运行 ， 需要 具备 Pentium 等 被 
称 为 x86 的 CPU( 微 处 理 器 )。 


(DD AT 兼容 机 是 指 ， 可 以 和 IBM 开发 的 PC/AT 在 硬件 上 相互 兼容 的 计算 机 的 
总 称 。 称 为 “PC/AT 兼容 机 ”和 “DOS/V 机 ”。 现 在 市 面 上 销售 的 大 部 分 
计算 机 都 是 AT 兼容 机 。 另 外 ，IBM 现在 已 经 把 计算 机 事业 部 卖 给 了 联想 。 

(2) Linux 是 1991 年 赫尔辛基 大 学 的 Linus Torvalds 开发 的 Unix 系 操作 系统 。 
发 布 后 得 到 了 很 多 有 上 志 者 的 协助 ， 为 其 追加 了 大 量 的 功能 。 在 服务 端 操 作 
系统 中 占有 上 比较 高 的 比率 。 

(3) 美国 Intel 的 微 处 理 器 ， 是 按照 8086、80286、80386、80486、Pentium*…… 
这 样 的 顺序 不 断 升 级 的 。 因 为 这 些 型 号 的 后 面 都 带 有 86， 所 以 总 称 为 x86。 
32 位 处 理 器 也 称 为 “IA-32”。 
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Office 2007 
用 四 


Office 2007 芍 | Office 2007 无 法 正常 
运行 蒜 措 AS 运行 的 环境 


图 7-1 操作 系统 和 硬件 共同 决定 应 用 的 运行 环境 


CPU 只 能 解释 其 自身 固有 的 机 需 语言 。 不 同 的 CPU 能 解释 的 机 带 
语言 的 种 类 也 是 不 同 的 。 例 如 ，CPU 有 x86、MIPS、SPARC 、PowerPC” 
等 几 种 类 型 ， 它 们 各 日 的 机 器 语言 是 完全 不 同 的 。 


机 器 语言 的 程序 称 为 本 地 代码 (native code )。 程 序 员 用 C 语言 
编写 的 程序 ， 在 编写 阶段 仅仅 是 文本 文件 。 文 本 文件 (排除 文字 编码 的 
问题 ) 在 任何 环境 下 都 能 显示 和 编辑 。 我 们 称 之 为 源 代 码 。 通 过 对 源 代 
码 进行 编译 ， 就 可 以 得 到 本 地 代码 。 在 市 面 上 出 售 的 用 于 Windows 的 应 
用 软件 包 CD-ROM 中 , 收录 的 就 不 是 源 代 码 , 而 是 本 地 代码 (图 7-2 )。 


(DD MIPS 是 美国 MIPS 科技 公司 开发 的 CPU。 曾 出 现 过 面向 MIPS 工作 站 的 
Windows， 不 过 现在 市 面 上 已 经 不 再 出 售 了 。SPARC 是 美国 SUN 系统 开 
发 的 CPU。 很 多 工作 站 都 采用 了 该 CPU。PowerPC 是 美国 苹果 、IBM、 摩 
托 罗 拉 共 同 开 发 的 CPU。 革 果 的 Power Mac 及 IBM 的 工作 站 都 采用 了 该 
CPU。 不 过 现在 的 Mac 采用 的 是 Intel 的 x86 系列 CPU。 

@ Windows 应 用 程序 的 本 地 代码 ， 通 常 是 EXE 文件 及 DLL 文件 等 形式 。 
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C 语 言 源 代码 


Homenuae < stonon ns 


veid main() { 
ET 


} 


x86 用 的 本 机 代码 


呈 S BBS DG 83 re 和 0 SS 7 DD 
@OmeSeriomnoonmom eee ee eon ee 
ESG LIG US2006 2 OO OU 
00 83 C4 04 5F 5E 5B 83 C4 40 3B 
HC 8 9 00 00 00 BB 5 SD C3 


图 7-2 CPU 负责 解析 并 运行 从 源 代码 编译 而 来 的 本 地 代码 


加 7.2 Windows 克服 了 CPU 以 外 的 硬件 差异 


计算 机 的 硬件 并 不 仅仅 是 由 CPU 构成 的 ， 还 包括 用 于 存储 程序 指 
令 和 数据 的 内 存 ， 以 及 通过 IO 连接 的 键盘 、 显 示 器 、 硬 盘 、 打 印 机 等 
外 围 设备 。 而 计算 机 是 如 何 控制 这 些 外 围 设备 的 呢 ? 这 和 计算 机 的 机 
型 有 着 很 大 的 关系 。 


Windows 操作 系统 对 克服 这 些 硬件 构成 的 差异 做 出 了 很 大 贡献 。 
在 介绍 Windows 之 前 ， 让 我 们 先 来 回顾 一 下 Windows 的 前 里 操作 系统 
MS-DOS 广泛 使 用 的 时 代 。 在 20 年 前 的 MS-DOS 时 代 , 日 本 国内 市 
场 上 有 NEC 的 PC-9801、 富 十 通 的 FMR、 东 芝 的 Dynabook 等 各 种 机 
型 的 计算 机 。Windows3.0 及 3.1 问世 前 后 ，AT 兼容 机 开始 普及 ， 并 开 
始 同 PC-9801 争夺 市 场 份额 。 


(D MS-DOS (Microsoft Disk Operating System ) 是 20 世纪 80 年 代 普 遍 使 用 的 
计算 机 操作 系统 。 
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这 些 机 型 虽然 都 搭载 了 486 及 Pentiunm 等 x86 系列 的 CPU， 不 过 
内 存 和 IO 地 址 的 构成 等 都 是 不 同 的 ， 因 此 每 个 机 型 都 需要 有 专门 的 
MS-DOS 应 用 。x86 提供 有 专门 用 来 同 外 围 设 备 进行 输入 输出 的 IO 地 
址 空间 (IO 地 址 分 配 )。 至 于 各 外 围 设备 会 分 配 到 什么 样 的 地 址 ， 则 
要 由 计算 机 的 机 型 来 定 。 


例如 ， 如 果 想 使 用 当时 大 热 的 文字 处 理 软件 一 一 JustSystem 的 “一 
太 妈 ”的话 ， 就 必须 要 买 各 个 机 型 专用 的 一 太 妈 软件 (图 7-3(a) )。 这 是 
因为 ， 应 用 软件 的 功能 中 ， 存 在 着 直接 操作 计算 机 硬件 的 部 分 。 而 这 
又 是 为 什么 呢 ? 原因 主要 有 两 点 ， 一 是 当时 MS-DOS 的 功能 尚 不 完善 ， 
二 是 为 了 提高 程序 的 运行 速度 。 


不 过 ， 随 着 Windows 的 广泛 使 用 ， 这 样 的 局 面 也 得 到 了 大 幅 改 善 。 
因为 只 要 Windows 能 正常 运行 ， 同 样 的 应 用 (本 地 代码 ) 在 任何 机 型 
上 都 是 可 以 运行 的 (图 7-3(b) )。 


Roa 


操作 系统 用 二 AI 阅 窑 机 用 PC 9801 Wk 的 Windows 的 Windows ya 


的 MS-DOS 的 MS-DOS 
硬件 ES = 5 
AT 兼容 机 PC-9801 | 

(a) MS-DOS 时 代 的 应 用 (b) Windows 时 代 的 应 用 


图 7.3 ”MS-DOS 中 ,不 同 机 型 的 应 用 是 不 同 的 ， 而 Windows 则 可 以 使 用 同一 个 应 用 ， 
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在 Windows 的 应 用 软件 中 ， 键 盘 输 入 、 显 示 需 输出 等 并 不 是 直接 
向 硬件 发 送 指令 ， 而 是 通过 向 Windows 发 送 指令 来 间接 实现 的 。 因 
此 ， 程 序 员 就 不 用 注意 内 存 和 IO 地 址 的 不 同 构成 了 。 因 为 Windows 
操作 的 是 便 件 而 非 应 用 软件 ， 而 且 针对 不 同 的 机 型 ， 这 些 便 件 的 构成 
也 是 有 差异 的 (图 7-4)。 不 过 ，Windows 本 身 则 需要 为 不 同 的 机 型 分 
别提 供 专 用 的 版 本 ， 比 如 用 于 AT 兼容 机 的 Windows、 用 于 PC-9081 的 
Windows 等 。 


使 用 操作 系统 “有 天 


的 功 A VV ee )W 
LL 


是 si [ 国 


硬件 一 


7-4 ”MS-DOS 应 用 大 多 都 是 不 经 过 操作 系统 而 直接 控制 硬件 的 ， 而 Windows 应 
用 则 基本 上 都 由 Windows 来 完成 对 硬件 的 控制 | 


而 即便 是 Windows， 也 依然 无 法 吸收 CPU 类 型 的 差异 。 这 是 因 
为 ， 市面 上 销售 的 Windows 应 用 软件 ， 都 是 用 特定 的 CPU 的 本 地 代码 
来 完成 的 。 


转 7.3 不 同 操作 系统 的 API 不 同 
接 下 来 让 我 们 看 一 下 操作 系统 的 种 类 。 同 样机 型 的 计算 机 ， 可 安 
装 的 操作 系统 类 型 也 会 有 多 种 选择 。 例 如 ，AT 兼容 机 的 情况 下 ， 除 
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Windows 之 外 , 还 可 以 采用 Unix 系列 的 Linux 及 FreeBSD 等 多 个 操作 
系统 。 当 然 ， 应 用 软件 则 必须 根据 不 同 的 操作 系统 类 型 来 专门 开发 。 
CPU 的 类 型 不 同 ， 所 对 应 的 机 器 语言 也 不 同 ， 同 样 的 道理 ， 操 作 系 统 
的 类 型 不 同 ， 应 用 程序 向 操作 系统 传递 指令 的 途径 也 是 不 同 的 。 


应 用 程序 回 操 作 系 统 传递 指令 的 途径 称 为 API (Application 
Programming Interface ) “。Windows 及 Unix 系列 操作 系统 的 API, 提供 
了 任何 应 用 程序 都 可 以 利用 的 也 数 组 合 。 因 为 不 同 操 作 系 统 的 API 是 
有 差异 的 ， 因 此 ， 将 同样 的 应 用 程序 移植 到 其 他 操作 系统 时 ， 就 必须 
要 重 写 应 用 中 利用 到 API 的 部 分 。 像 键盘 输入 、 鼠 标 输入 、 显 示 天 输 
出 、 文 件 输入 输出 等 同 外 围 设 备 进行 输入 输出 操作 的 功能 ， 都 是 通过 
API 提供 的 。 


在 同类 型 操作 系统 下 ， 不 管 便 件 如 何 ，API 基本 上 没有 差别 。 
而 ， 针 对 某 特定 操作 系统 的 API 所 编写 的 程序 ， 在 任何 硬件 上 都 可 以 
运行 。 当 然 ， 由 于 CPU 种 类 不 同 ， 机 融 语 言 也 不 相同 ， 因 此 本 地 代码 
当然 也 是 不 同 的 。 这 种 情况 下 ， 就 需要 利用 能 够 生成 各 CPU 专用 的 本 
地 代码 的 编译 副 ， 来 对 源 代码 进行 重新 编 详 了 。 


程序 (本 地 代码 ) 的 运行 环境 是 由 操作 系统 和 便 件 来 决定 的 ， 这 一 
扩 想 必 大 家 都 清楚 了 吧 。 


7.4 FreeBSD Port 帮 你 轻松 使 用 源 代码 
不 知道 各 位 读者 会 不 会 有 这 样 的 想法 :“ 既 然 CPU 类 型 不 同 会 导致 


QD FreeBSD 是 1993 年 加 州 大 学 伯克利 分 校 的 Computer Systems Research 
Group 在 4.4BSD-Lite 的 基础 上 开发 的 Unix 系列 操作 系统 。 

@ API 也 称 为 “系统 调用 "”， 是 应 用 调用 操作 系统 功能 的 手段 。 关 于 系统 调 
用 ， 我 们 会 在 第 9 章 进行 详细 说 明 。 
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同样 的 本 地 代码 无 法 重复 利用 ， 那 么 为 何不 直接 把 源 代码 分 发 给 程序 
呢 ?” 的 确 ， 这 也 是 一 种 方法 。 部 分 Unix 系列 操作 系统 就 对 此 进行 了 灵 
活 应 用 。 


Unix 系列 操作 系统 FreeBSD 中 ， 存 在 一 种 名 为 Ports 的 机 制 。 该 
机 制 能 够 结合 当前 运行 的 硬件 环境 来 编译 应 用 的 源 代 码 ， 进 而 得 到 可 
以 运行 的 本 地 代码 系统 。 如 果 目 标 应 用 的 源 代码 没有 在 硬件 上 的 话 ， 
Ports 就 会 自动 使 用 FTP 连接 到 相关 站 点 来 下 载 代码 ( 图 7-5 ) 


FreeBSD 运 行 的 硬件 环境 提供 代码 的 站 点 


(1 ) 请 来 源 代码 Ee 
FTP (2 ) 传送 源 
( 3 ) 编译 源 代码 = 源 
me (4) 


代码 
运行 应 用 


图 7-5 FreeBSD 的 Ports 机 制 | 


全 球 很 多 站 点 都 提供 适用 于 FreeBSD 的 应 用 源 代码 。 通 过 使 用 
Ports 可 以 利用 的 程序 源 代码 ， 大 约 有 16000 种 。 这 些 代 人 码 还 被 按照 不 
同 的 领域 进行 了 分 类 整理 ， 可 以 随时 拿 来 使 用 。 


FreeBSD 上 应 用 的 源 代码 ， 大 部 分 部 是 用 C 语 言 来 记述 的 。 
FreeBSD 等 Unix 系列 操作 系统 中 ， 都 带 有 标准 的 C 编译 右 。C 编译 需 
可 以 结合 FreeBSD 的 运行 环境 生成 合适 的 本 地 代码 。 因 而 ， 使 用 
FreeBSD 的 同时 ， 肯 定 也 会 享受 到 Ports 市 来 的 益处 。 可 以 说 Ports 能 
人 够 元 服 包含 CPU 在 内 的 所 有 人 硬件 差异 的 系统 。 而 且 ，Ports 这 个 术语 ， 
表示 的 是 porting (移植 ) 的 意思 。 而 根据 不 同 的 运行 环境 来 重新 调整 程 


(DD FTP (File Transfer Protocol ) 是 连接 到 互联 网 上 的 计算 机 之 间 传 送 文件 的 协议 。 
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序 ， 一 般 也 称 为 “移植 ”。 


国 7.5 “利用 虚拟 机 获得 其 他 操作 系统 环境 

即使 不 通过 移植 ， 也 可 以 使 用 别 的 方法 来 运行 其 他 操作 系统 的 应 
用 。 这 里 我 们 要 介绍 的 方法 就 是 利用 虚拟 机 软件 。 笔 者 的 计算 机 上 就 
安装 了 Macintosh 的 “Virtual PC for Mac” 。 通 过 利用 该 虚拟 机 ,我 们 就 
可 以 在 Macintosh 的 Mac 操作 系统 上 运行 Windows 应 用 了 。 


Virtual PC for MAC 可 以 使 Macintosh 这 一 人 硬件 变 得 同 AT 兼容 机 一 
样 ， 从 而 能 在 该 便 件 上 安装 Windows。 这 样 一 来 ，Windows 下 的 所 有 
应 用 就 都 可 以 正常 运行 了 。Windows 应 用 利用 的 是 Windows 操作 系统 
的 API。 虽 然 表 面 上 是 Windows 将 便 件 处 理 为 了 AT 兼容 机 ， 但 由 于 
Virtual PC for MAC 的 作用 ， 实 际 上 运行 的 是 Macintosh 这 一 人 硬件。 


图 7-6 是 在 PowerBook G4 这 个 机 型 ( CPU 不 是 x86 而 是 PowerPC 
G4 ) 的 Macintosh 上 ， 通 过 使 用 Virtual PC for MAC 起 动 Windows XP 
来 运行 Windows 的 音乐 应 用 “BAND IN A BOX 14” 的 情况 。 可 以 发 
现 ， 虽然 运行 速度 有 点 慢 ， 但 确实 能 正常 运行 。 


Q) Macintosh (统称 为 Mac ) 是 美国 苹果 公司 生产 的 计算 机 。 这 些 计算 机 用 的 
是 名 为 Mac OS 的 操作 系统 。Virtual PC for Mac 是 美国 微软 的 产品 ， 需 要 
单独 购买 。2006 年 ， 美 国 微软 终止 了 Virtual PC for Mac 的 开发 。 这 是 因为 
Mac 采用 了 Intel CPU 的 缘故 。 这 里 介绍 的 Virtual PC for Mac 是 采用 Power 
PC CPU 的 Mac 上 使 用 的 软件 。 
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OO 
SO 
) ) _) 种 7 章 程序 征 在 何 种 环境 是 运行 的 ) ) ) ) ) )  ) . ) ))  ) )))) _)) 
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| 图 7-6 在 Macintosh 上 运行 Windows XP 和 Windows 的 应 用 


除 虚拟 机 的 方法 之 外 ， 还 有 一 种 方法 能 够 提供 不 依赖 于 特定 硬件 
及 操作 系统 的 程序 运行 环境 ， 那 加 是 Java。 


大 家 说 的 Java， 有 两 个 层面 的 意思 。 一 个 是 作为 编程 霹 言 的 Java， 
另 一 个 是 作为 程序 运行 环境 的 Java。 同 其 他 编程 语言 相同 ，Java 也 是 
将 Java 语法 记述 的 源 代 码 编 主 后 运行 。 不 过 ， 编 谋 后 生成 的 并 不 是 特 
定 CPU 使 用 的 本 地 代码 ， 而 是 名 为 字 市 代码 的 程序 。 字 节 代 码 的 运行 
环境 就 称 为 Java 虚拟 机 (JavaVM，Java Virtual Machine )。Java 虚拟 
机 是 一 边 把 Java 字 世 代码 逐一 转换 成 本 地 代码 一 边 运行 的 。 


例如 ， 在 使 用 用 于 AT 兼容 机 的 Java 编译 占 和 Java 虚拟 机 的 情况 
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下 ， 编 译 硕 会 将 程序 员 编写 的 源 代 码 ( sample.java ) 转换 成 字 厄 代码 
( sample.class )。 而 Java 虚拟 机 ( java.exe ) 则 会 把 字 节 代码 变换 成 86 
系列 CPU 适用 的 本 地 代码 ， 然 后 由 x86 系列 CPU 负责 实际 的 处 理 。 
在 程序 运行 时 ， 将 编 府 后 的 字 市 代码 转换 成 本 地 代码 ， 这 样 的 操 
作 方 法 看 上 去 有 些 迁 回 ， 但 由 此 可 以 实现 同样 的 字 节 代码 在 不 同 的 环 
境 下 运行 。 如 果 能 够 结合 各 种 类 型 的 操作 系统 和 硬件 作成 Java 虚拟 机 ， 
那么 ， 同 样 学 厄 代 码 的 应 用 就 可 以 在 任何 环境 下 运行 了 (图 7-7 )。 


Java 源 代码 
| :> 的 编译 器 


用 于 Windows 的 用 于 Macintosh 的 
Java 虚 拟 机 Java 虚 拟 机 


Nao Nec 


一 一 二 AT 莱 容 机 | | 
7-7 ”Java 应 用 在 Java 虚拟 机 上 运行 


Windows 有 Windows 专用 的 Java 虚拟 机 ，Macintosh 也 有 Macintosh 
专用 的 Java 虚拟 机 。 从 操作 系统 方面 来 看 ，Java 虚拟 机 是 一 个 应 用 ， 


(D PDA (Personal Digital Assistant ) 是 指 可 以 放 入 手提 包 中 的 小 型 手持 计算 
机 。 也 称 为 “手持 设备 ”。 
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而 从 Java 应 用 方面 来 看 ，Java 虚拟 机 就 是 运行 环境 。 虽 然 这 样 看 起 来 
Java 虚拟 机 全 是 好 处 ,但 其 实 也 有 不 少 问题 。 其 中 一 点 就 是 ， 不 同 的 
Java 虚拟 机 之 间 无 法 进行 完整 互 换 。 这 是 因为 ， 想 让 所 有 字 市 代码 在 
任意 Java 虚拟 机 上 都 能 运行 是 比较 困难 的 。 而 且 ， 当 我 们 使 用 只 适用 
于 某 些 特定 硬件 的 功能 时 ， 就 会 出 现在 其 他 Java 虚拟 机 上 无 法 运行 ， 
或 者 功能 使 用 受 限 等 情况 。 


男 一 点 就 是 运行 速度 的 问题 。Java 虚拟 机 每 次 运行 时 都 要 把 字 节 
代码 变换 成 本 机 代码 ， 这 一 机 制 是 造成 运行 速度 慢 的 原因 。 为 此 ， 目 
前 业界 也 在 努力 改善 这 一 问题 ， 比 如 把 首次 变换 后 的 本 地 代码 保存 起 
来 ， 第 2 次 以 后 直接 利用 本 地 代码 ， 或 是 对 字 市 代码 中 处 理 较为 费时 
的 部 分 进行 优化 ( 改善 生成 的 本 地 代码 质量 ) 等 。 


图 7.7 BIOS 和 引导 

最 后 对 一 些 比较 基础 4 和 人 硬件 相近 的 部 分 ) 的 内 容 做 一 下 补充 说 明 。 
程序 的 运行 环境 中 ， 存 在 着 名 为 BIOS ( Basic Input/Output System ) 的 系 
统 。BIOS 存储 在 ROM 中， 是 预先 内 置 在 计算 机 主机 内 部 的 程序 。 
BIOS 除了 键盘、 位 盘 、 显 卡 等 基本 控制 程序 外 ， 还 有 启动 “引导 程序 ” 
的 功能 。 引 导 程 序 是 存储 在 启动 驱动 器 起 始 区 域 的 小 程序 。 操 作 系统 的 
启动 驱动 器 一 般 是 硬盘 ， 不 过 有 时 也 可 以 是 CD-ROM 或 软盘 。 


开机 后 ，BIOS 会 确认 便 件 是 否 正 第 运行 ,没有 问题 的 话 就 会 局 动 
引导 程序 。 引 导 程 序 的 功能 是 把 在 硬盘 等 记录 的 OS 加 载 到 内 存 中 运 
行 。 虽然 启动 应 用 是 OS 的 功能 , 但 OS 并 不 能 自己 局 动 目 己 ， 而 是 通 
过 引 叶 程序 来 启动 。 


Bootstrap 的 原意 是 指 训 子 上 部 的 “ 拔 识 之”。BIOS 这 样 小 的 程序 
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( 拨 靴 带 )， 可 以 带动 (局 动 ) 操作 系统 这 样 的 大 程序 (鞭子 )， 所 以 由 
此 得 名 (图 7-8 )。 虽然 操作 系统 运行 以 后 ， 程 序 员 束 不 用 再 关注 BIOS 
及 引导 程序 了 ,但 需要 知道 它们 的 存在 。 


大 操作 系统 


图 7-8 小 引导 程序 带动 大 操作 系统 


本 半 我 们 一 起 了 解 了 应 用 程序 的 运行 环境 ， 并 对 源 代 人 码 和 本 地 代 
码 进行 了 简单 的 说 明 。 下 一 革 ， 我 们 将 对 源 代 码 转 换 到 本 地 代码 的 流 
程 ， 也 就 是 “ 编 详 ” 进 行 详细 说 明 。 
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9 天 | 身 | 问 | 管 上 
阅读 正文 前 ， 让 我 们 先 回答 下 面 的 问题 来 热 热 身 吧 。 


. CPU 可 以 解析 和 运行 的 程序 形式 称 为 什么 代码 ? 

. 将 多 个 目标 文件 结合 生成 EXE 文件 的 工具 称 为 什么 ? 

. 扩展 名 为 .obj 的 目标 文件 的 内 容 ， 是 源 代码 还 是 本 地 代码 ? 

. 把 多 个 目标 文件 收录 在 一 起 的 文件 称 为 什么 ? 

. 仅 包 含 Windows 的 DLL 文件 中 存储 的 函数 信息 的 文件 称 为 
人 22? 

6. 在 程序 运行 时 ， 用 来 动态 申请 分 配 的 数据 和 对 象 的 内 存 区 域 

形式 称 为 什么 ? 


Ol 信 ND 一 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 
是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


1. 本 地 代码 ( 机 器 语言 代码 ) 
2. 链接 器 

3. 本 地 代码 

4. 库 文件 

5. 导入 库 

6 


1. 通过 编译 源 代码 得 到 本 地 代码 。 

2. 通过 编译 和 链接 ， 得 到 EXE 文件 。 

3. 通过 对 源 文件 进行 编译 ， 得 到 目标 文件 。 例 如 ，C 语言 中 ,将 
Samplel.c 这 个 源 文 件 编 幸 后 ， 怠 会 得 到 Samplel.obj 这 个 目标 
文件 。 目 标 文件 的 内 容 是 本 地 代码 。 

4. 链接 带 会 从 库 文件 中 抽取 出 必要 的 目标 文件 并 将 其 结合 到 EXE 
文件 中 。 此 外 ， 还 存在 一 种 程序 运行 时 结合 的 DLL 形式 的 库 


文件 。 
5， 把 导入 库 信 息 结合 到 EXE 文件 中 ， 这 样 程序 在 运行 时 就 可 以 利 
用 DLL 内 的 消 数 了 。 


6. 堆 的 内 存 空间 会 根据 程序 的 命令 进行 申请 及 释放 。 
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源 代码 完成 后 ， 就 可 以 编译 生成 可 执行 文件 了 。 
负责 实现 该 功能 的 是 编译 器 。 本 章 将 围绕 着 编译 器 的 
功能 ， 详 细 介 绍 从 程序 编写 到 运行 为 止 的 流程 。 首 先 ， 我 们 会 和 大 家 
一 起 看 一 下 源 文件 是 如 何 通 过 编译 转换 成 可 执行 文件 的 。 接 下 来 ， 我 
们 会 继续 关注 可 执行 文件 被 加 载 到 内 存 后 的 运行 机 制 。 此 外 ， 还 会 对 
程序 运行 时 内 存 上 的 栈 及 堆 进行 说 明 。 由 于 篇 幅 有 限 ， 本 章 只 介绍 了 
用 C 语言 编译 器 ”来 编写 Windows 用 的 可 执行 文件 ( EXE 文件 ) 的 示 
例 ， 不 过 其 他 环境 及 编程 语言 等 采用 的 基本 上 是 同样 的 机 制 。 因 此 ， 
即使 不 了 解 C 语言 的 相关 知识 也 不 会 有 影响 ， 这 一 点 请 大 家 放心 。 


国 3.1 计算 机 只 能 运行 本 地 代码 

首先 ， 请 大 家 看 一 下 代码 清单 8-1。 这 是 一 个 用 C 语言 记述 的 
Windows 程序 。 该 程序 运行 后 ， 会 把 123 和 456 的 平均 值 289.5 显示 在 
消息 框 〈 图 8-1 ) 中 。 程 序 的 内 容 并 没有 什么 意思 ， 这 里 仅仅 是 作为 例 
子 使 用 而 已 。 


代码 清单 8-1 ”求解 平均 值 的 程序 


COES wo ns 
#include <stdio.h> 


// 消息 框 的 标题 
char* title = "示例 程序 1" ; 


(DD 本 书 使 用 的 是 Borland C++ Compiler 5.5。 命令 行 版 的 Borland C++ Compiler 
5.5 可 以 从 Borland 的 网 站 ( http://borland.conyjp/products/cbuilder/freecompiler. 
html 2007.1 ) 上 免费 下 载 。C++ 是 在 C 语言 的 基础 上 追加 相应 功能 而 开发 
出 来 的 编程 语言 。 用 C 语言 编写 的 源 文件 ， 也 可 以 在 C++ 编译 器 上 进行 
编译 。 

@ 消息 框 是 一 个 为 了 显示 短 消 息 而 出 现 的 小 窗口 。 
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// 返回 两 个 参数 的 平均 值 的 函数 一 一 一 一 一 
double Average (double a, double b) { 


(a 1) 


return 2 
人 


// 程序 运行 启 始 位 置 的 函数 
int WINAPI WinMain (HINSTANCE h, HINSTANCE d, LPSTR s, int m) 


{ 


double ave; // 保存 平均 值 的 变量 
char luffle0l; // 保存 字符 串 的 变量 


// 求解 123 ,456 的 平均 值 


ave = Average (123, 456); 


// 编写 显示 在 消息 框 中 的 字符 是 


SETNEE(NUEE 下 的 依 和 (0 
// 打开 消息 框 

MessageBox (NULL, Putf ”title, MBOKR); — (7 

ecu Op 


平均 值 = 289.500000 


图 8-1 ”代码 清单 8-1 的 执行 结果 


类 似 于 代码 清单 8-1 这 样 ， 用 某 种 编程 语言 编写 的 程序 就 称 为 源 代 
码 “， 保 存 源 代码 的 文件 称 为 源 文 件 。 用 C 语言 编写 的 源 文件 的 扩展 名 
通常 是 “.c”， 因 此 ， 这 里 我 们 就 把 代码 清单 8-1 的 文件 命名 为 Samplel.c。 


QQ) 这 里 的 “ 源 代码 ”用 英文 表示 是 “source code”。source 有 “原始 的 ”的 意 
思 ， 因 此 所 谓 源 代码 ， 就 是 原始 的 代码 。 源 代码 有 时 也 称 为 源 程序 。 
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因为 源 文件 是 简单 的 文本 文件 ， 所 以 用 Windows 目 寓 的 记事 本 等 文本 
编辑 各 就 可 以 编写 。 

代码 清单 8-1 的 源 代码 是 无 法 直接 运行 的 。 这 是 因为 ，CPU 能 
接 解 析 并 运行 的 不 是 源 代码 而 是 本 地 代码 的 程序 。 作 为 计算 机 大 脑 的 
Pentium 等 CPU， 也 只 能 解释 已 经 转换 成 本 地 代码 的 程序 内 容 。 


本 地 (native ) 这 个 术语 有 “母语 的 ”意思 。 对 CPU 来 说 ， 和 母语 就 
是 机 器 语言 ， 而 转换 成 机 器 语言 的 程序 就 是 本 地 代码 。 用 任何 编程 语 
言 编写 的 源 代 码 ， 最 后 都 要 翻译 成 本 地 代码 ( 图 8-2 )， 否 则 CPU 就 不 
能 理解 。 也 就 是 说 ， 即 使 是 用 不 同 编程 语言 编写 的 代码 ， 转 换 成 本 地 
代码 后 ， 也 都 变 成 用 同一 种 语言 ( 机 器 语言 ) 来 表示 了 。 


不 同 的 编程 语言 互 ~ 。" 同样 的 编程 语言 二 


本 2 

目 六 汪 3 国 

C 语 语 盏 言 编写 | 的 N 

加 

a = 

国 四 J 

国 pI N = 

加 ， i i a a i 国 KR\Y 国 站 

C++ 语言 编写 的 | = 
加 \ 一 /一 
= 代码 | 解析 运行 

局 

四 

加 

转 


8-2 ”转换 成 本 地 代码 后 就 变 成 了 同样 的 语言 


围 3.2 本 地 代码 的 内 容 
Windows 中 EXE 文件 的 程序 内 容 ， 使 用 的 就 是 本 地 代码 。 正 所 谓 
“ 百 闻 不 如 一 见 ”"， 接 下 来 就 让 我 们 来 看 一 下 本 地 代码 的 内 容 吧 。 
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用 记事 本 打开 由 代码 清单 8-1 的 内 容 转换 成 本 地 代码 得 到 的 EXE 


文件 ( Samplel.exe )， 页 面 显示 情况 如 图 8-3 所 示 。 据 此 我 们 应 该 可 以 
看 出 ， 本 地 代码 的 内 容 是 人 类 无 法 理解 的 。 也 正 是 因为 如 此 , 才 有 了 


用 人 类 


容易 理解 的 C 语言 等 编程 语言 来 编写 源 代 码 ， 然 后 再 将 源 代码 


转换 成 本 地 代码 这 一 方法 。 


“| Samplel.exe - 记事 本 

| 编辑 ( 格式 (0) ”查看 (V) ”帮助 

a DR 

] 和 1 Ege 1 入 ” 和民 :] 二 生 

于 右 ， S 隧 / ， " Y 急 ”WS 有 " 纺 ， 
+ "YA x7@ he . "7@ Ps- ¥9@ c 人 

¥u. TN 和 二 二 ¥ a Ee t 
t "由 中 3 3 j RY 3 
h h 雹 
让 

@ 


h 7 pyy @ 销 . 
1 cru 人， 才 VRSPA 
"+t 席 : 


六 并 “Ex 5 禁 ' ， uz"H"Huy 
#@ +#@ flo "外 |aa@ st 730 


> 


图 8-3 ”用 记事 本 打开 EXE 文件 后 出 现 了 无 法 理解 的 文字 


接 下 来 ， 我 们 把 刚才 的 EXE 文件 的 内 容 Dump 一 下 。Dump 是 指 


把 文件 的 内 容 ， 每 个 字 市 用 2 位 十 六 进 制 数 来 表示 的 方式 。 本 地 代码 
的 内 容 就 是 各 种 数值 的 罗列 ， 这 一 点 想必 大 家 都 了 解 。 而 这 些 数 值 就 
是 本 地 代码 的 真面目 。 每 个 数值 都 表示 某 一 个 命令 或 数据 (图 8-4 )。 
这 里 我 们 用 的 是 原始 的 Dump 程序 。 


ae 例如 ，A 
数据 就 是 用 十 六 进 制 数 41 来 表示 的 。 与 此 相同 ， 计 算 机 指令 
we 
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[起 campnle ,EXE -Dump 
区 能 局 


89 55 CE 74 OD OF BF 45 CE 39 89 45 D8 89 55 DC 
EB 38 OF B? 45 CE 33 D2 89 45 D8 89 55 DC EB 2é 
83 45 1C 04 8B 45 1C 84 C9 8B 50 FC 89 55 DO 74 ~ 


1 [El ， :| 
| 


图 8-4 本 地 代码 的 真面目 是 数值 的 罗列 


8.3 ”编译 器 负责 转换 源 代码 

能 够 把 C 语言 等 高 级 编程 语言 编写 的 源 代 码 转换 成 本 地 代码 的 程 
序 称 为 编译 器 。 每 个 编写 源 代码 的 编程 语言 都 需要 其 专用 的 编 详 角 。 
将 C 二 言 编写 的 源 代码 转换 成 本 地 代码 的 编 详 角 称 为 C 编 详 角 。 


编 详 角 首先 谈 和 人 代码 的 内 容 ， 然 后 再 把 源 代 码 转换 成 本 地 代码 。 
编 详 硕 中 就 好 像 有 一 个 源 代 码 同 本 地 代码 的 对 应 表 。 但 实际 上 ， 仅 仅 
菲 对 应 表 是 无 法 生成 本 地 代码 的 。 恋 入 的 源 代 码 还 要 经 过 语法 解析 、 
句法 解析 、 语 义 解 析 等 ， 才 能 生成 本 地 代码 。 


根据 CPU 类 型 的 不 同 ， 本 地 代码 的 类 型 也 不 同 。 因 而 ， 编 译 右 不 
仅 和 编程 语言 的 种 类 有 关 ， 和 CPU 的 类 型 也 是 相关 的 。 例 如 ，Pentium 
等 x86 系列 CPU 用 的 C 编译 器 ， 同 PowerPC 这 种 CPU 用 的 C 编译 央 
就 不 同 。 从 另 一 个 方面 来 看 ， 这 其 实 是 非常 方便 的 。 因 为 这 样 一 来 ， 
同样 的 源 代码 就 可 以 翻译 成 适用 于 不 同 CPU 的 本 地 代码 了 (图 8-5 )。 
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编译 器 
C 语 言 


源 代码 
Power PC 用 的 转换 Power PC 用 的 
编译 器 本 地 代码 


图 8-5 同样 的 源 代码 可 以 转换 成 适用 于 不 同 处 理 器 的 本 地 代码 


因为 编译 冀 本 里 也 是 程序 的 一 种 ， 所 以 也 需要 运行 环境 。 例 如 ， 
有 Windows 用 的 C 编译 器 、Linux 用 的 C 编译 器 等 。 此 外 ， 还 有 一 
种 交叉 编译 器 ， 它 生成 的 是 和 运行 环境 中 的 CPU 不 同 的 CPU 所 使 用 的 
本 地 人 代码。 例如， 在 Pentium 系列 CPU 的 Windows 这 一 运行 环境 下 ， 
也 可 以 作成 SH 及 MIPS 等 CPU 用 的 Windows CE 程序 ， 而 这 就 是 通 
过 使 用 交叉 编译 器 来 实现 的 。 


读 到 这 里 大 家 可 能 稍微 有 一 些 混乱 ， 不 妨 让 我 们 来 梳理 一 下 。 大 
家 在 计算 机 软件 商店 等 处 购买 编译 器 时 ， 可 能 会 跟 店员 说 明 3 点 :“ 想 
要 买 的 是 何 种 编程 语言 用 的 编译 器 ”“ 编 译 器 生成 的 本 地 代码 是 用 于 哪 
种 CPU 的 ”以 及 “该 编译 器 是 在 什么 环境 下 使 用 的 ”( 图 8-6 )。 而 实际 
上 ， 通 常 只 要 说 明 产 品名 及 版 本 就 可 以 了 。 


(DD SH (SuperH ) 是 日 立 制作 所 和 三 鞭 电 机 共同 成 立 的 瑞 萨 技 术 开 发 的 CPU。 
该 CPU 有 多 种 类 型 ， 在 手机 、 车 载 GPS、PDA、 游 戏 机 等 设备 上 均 有 使 用 。 

(2 Windows CE 是 采用 了 MIPS、SH 等 CPU 的 PDA 及 能 入 式 开 发 领域 广泛 
使 用 的 操作 系统 。 

(3) 现在 编译 器 基本 上 不 需要 购买 ， 都 已 经 默认 集成 到 开发 IDE 中 了 。 


译 者 注 
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请 帮 有 我 拿 一 个 C 语 言 用 的 、 用 来 输出 
x86 系 CPU 本 地 代码 的 、Windows 
环境 下 的 编译 器 


好 的 ， 给 您 


图 8-6 “确定 编译 器 种 类 的 三 个 关键 词 


[ 国 3.4 仅 靠 编译 是 无 法 得 到 可 执行 文件 的 

编译 需 转 换 源 代码 后 ， 就 会 生成 本 地 文件 。 不 过 ， 本 地 文件 是 无 
法 直接 运行 的 。 为 了 得 到 可 以 运行 的 EXE 文件 ， 编 译 之 后 还 需要 进行 
“链接 ”处 理 。 下 面 ， 就 让 我 们 使 用 Borland C++ Compiler5.5 (以 下 称 
为 Borland C++ ) 来 看 一 下 编译 和 链接 是 如 何 进行 的 。 

Borland C++ 的 编 详 器 是 bcc32.exe 这 个 命令 行 工 具 。 在 Windows 
的 命令 提示 符 ” 中 ,运行 下 列 命令 后 , 由 C 语言 编写 的 源 文件 Smaplel.c 
就 会 被 编译 。 

bcc32 -W -C Samplel.c 


“-W-c” 是 用 来 指定 编译 Windows 用 的 程序 的 选项 。 选 项 是 对 编译 
天 的 指示 。 有 时 也 称 为 “开关 ”。 
@ 命令 行 工 具 指 的 是 在 Windows 的 命令 提示 符 下 使 用 的 CUI 程序 。 


@) 编译 Samplel.c 后 ， 可 能 会 出 现 WinMain 的 参数 没有 被 用 到 的 警告 提示 ， 不 
过 这 不 会 造成 什么 影响 。 由 于 警告 并 不 是 出 错 ， 因 而 也 可 以 生成 目标 文件 。 
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编译 后 生成 的 不 是 EXE 文件 ， 而 是 扩展 名 为 “.obj” 的 目标 文件 。 
Samplel.c 编译 后 ， 就 生成 了 Samplel.obj 目标 文件 。 虽 然 目标 文件 的 
内 容 是 本 地 代码 ， 但 却 无 法 直接 和 运行。 那么 这 是 为 什么 呢 ? 原因 就 是 
当前 程序 还 处 于 未 完成 状态 。 


让 我 们 再 来 看 一 过 代码 清单 8-1 中 的 源 代 码 。( 1 ) 围 起 来 的 呆 数 
Average0 同 (2 ) 围 起 来 的 函数 WinMain0 是 程序 员 自 己 作成 的 ， 处 理 
内 容 记 述 在 源 代码 中 。Average0 是 用 来 返回 两 个 参数 数值 的 平均 值 的 
国 数 ，Winmain0) 是 程序 的 运行 起 始 函 数 。 除 此 之 外 ， 还 有 (3 ) 指出 的 
sprintf() 晒 数 和 (4 ) 指出 的 MessageBox0 国 数 。sprintfO 是 通过 指定 格 
式 把 数值 变换 成 字符 串 的 因数 ，MessageBox0 是 消息 框 哨 数 ， 不 过 源 
代码 中 都 没有 记述 这 些 本 数 的 处 理 内 容 。 因 此 ， 这 时 就 必须 将 存储 春 
sprintf() 和 MessageBox() 的 处 理 内 容 的 目标 文件 同 Samplel.obj 结合 ， 
否则 处 理 就 不 完整 ，EXE 文件 也 就 无 法 完成 。 


把 多 个 目标 文件 结合 ， 生 成 1 个 EXE 文件 的 处 理 就 是 链接 ， 运 行 
连接 的 程序 就 称 为 链接 器 ( linkage editor 或 连结 从 )。Borland C++ 的 链 
接 需 就 是 ilink32.exe 的 命令 行 工 具 。 在 Windows 命令 提示 符 下 运行 以 
下 命令 后 ， 程 序 所 需 的 目标 文件 就 会 被 全 部 链接 生成 Samplel.exe 这 个 
EXE 文件 。 


llink32 -Tpe -C -x -aa COw32.0b] Samplel.ob]j, Samplel .exe,, 


import32.11b cw32.11b 


(DD 目标 文件 (object file ) 中 的 object 一 词 ， 指 的 是 编译 器 生成 结果 的 意思 。 
和 面向 对 象 编程 (object oriented programming ) 的 object 没有 任何 关系 。 面 
向 对 象 编程 的 对 象 指 的 是 数据 和 处 理 的 集合 体 。 
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较 3.5 启动 及 库 文件 


链接 选项 “-Tpe-c-x-aa” 是 指定 生成 Windows 用 的 EXE 文件 的 选 


项 。 在 这 些 选 项 之 后 ， 会 指定 结合 的 目标 文件 。 而 该 命令 行 中 就 指定 
了 c0w32.0bj 、Samplel.obj 这 两 个 目标 文件 ， 这 点 相信 大 家 都 能 看 得 出 
来 。Samplel.obj 是 Samplel.c 编译 后 得 到 的 目标 文件 。c0w32.obj 这 个 
目标 文件 记述 的 是 同 所 有 程序 起 始 位 置 相 结 合 的 处 理 内 容 ， 称 为 程序 
的 启动 。 因 而 ， 即 使 程序 不 调用 其 他 目标 文件 的 函数 ， 也 必须 要 进行 
链接 ， 并 和 启动 结合 起 来 。c0w32.obj 是 由 Borland C++ 提供 的 。 如 果 
C : 盘 中 安装 有 Borland C++ 的 话 ， 文 件 夹 C:\Borland\bcc55\ib 中 就 会 
有 c0w32.obj 这 个 文件 。 


那么 ， 大 家 可 能 会 有 这 样 一 个 疑问 :“ 链 接 时 不 指定 sprintf() 和 
MessageBox() 的 目标 文件 也 没 问 题 么 ?” 这 个 担心 是 多 余 的 。 在 链接 的 
命令 行 末 尾 ， 存 在 着 扩展 名 是 “.lib” 的 import32.lib 和 cw32.lib 这 两 个 
文件 。 这 是 因为 sprintf 的 目标 文件 在 cw32.lib 中 ，MessageBox( 的 日 
标 文件 在 import32.lib 中 (实际 上 ，MessageBox0 的 目标 文件 在 user32. 
dll 这 个 DLL 文件 中 。 关 于 这 一 点 ， 我 们 会 在 后 面 进行 说 明 )。 


像 import32.lib 及 cw32.lib 这 样 的 文件 称 为 库 文件 。 库 文件 指 的 是 
把 多 个 目标 文件 集成 保存 到 一 个 文件 中 的 形式 。 链 接 需 指定 库 文 件 后 ， 
就 会 从 中 把 需要 的 目标 文件 抽取 出 来 ,并 同 其 他 目标 文件 结合 生成 
EXE 文件 。 


Samplel.obj 是 尚未 完成 的 本 地 代码 ， 这 个 在 前 面 已 经 进行 了 说 
明 。 这 是 因为 ，Samplel.obj 文件 中 包含 有 “链接 时 请 结合 sprintf0 及 
MessageBox()” 这 样 的 信息 。 意 思 是 如 果 不 存 在 其 他 清 数 的 话 ， 程 序 就 
无 法 运行 。 下 面 ， 我 们 就 来 做 一 个 尝试 ， 看 看 在 不 指定 这 两 个 库 文件 
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的 情况 下 进行 链接 会 发 生 什 么 。 


1link32 -Tpe -Cc -x -aa CO0Ow32.ob]j Samplel.ob]j, Samplel .exe 


在 命令 提示 符 上 运行 上 述 命 令 后 ， 链 接 需 就 会 出 现 如 网 8-7 所 示 的 
错误 消息 (实际 上 显示 的 错误 消息 更 多 ， 这 里 对 其 进行 了 省 略 )。 


Emorm EE A Som (SC ESIBPSAVMPLERNOBY, 
Error: 无 法 解析 外 部 符号 'MessageBoxA' ( 请 参考 C\TESTBPR\SAMPLE1.OBJ ) 


该 错误 消息 表示 的 是 无 法 解析 Samplel.obj 参照 的 外 部 符号 。 外 部 
符号 是 指 其 他 目标 文件 中 的 变量 或 函数 。sprintf 及 MessageBoxA 是 目 
标 文 件 中 sprintf() 及 MessageBox0 的 名 称 。 代 码 中 记述 的 肾 数 名 同日 
标 文件 中 的 也 数 名 有 一 些 差 异 ， 不 过 大 家 只 需 把 它 理解 成 这 是 C 编译 
合 有 的 规定 即 可 。 错 误 消 奶 “ 无 法 解析 的 外 部 符号 ”表示 的 是 无 法 找到 记 
述 看 目的 变量 及 函数 的 目标 文件 ， 因 而 无 法 进行 链接 的 意思 。 


sprintfg 等 函数 ， 不 是 通过 源 代 码 形式 而 是 通过 库 文 件 形式 和 编译 
人 一 起 提供 的 。 这 样 的 函数 称 为 标准 了 渔 数 。 之 所 以 使 用 库 文 件 ， 是 为 
本 简化 为 链接 可 的 参数 指定 多 个 目标 文件 这 一 过 程 。 例 如 ， 在 链接 调 
用 了 数 百 个 标准 函数 的 程序 时 ， 就 要 在 链接 大 的 命令 行 中 指定 数 百 个 
目标 文件 ， 这 样 驶 太 索 琐 了 。 而 利用 存储 着 多 个 目标 文件 的 库 文 件 的 
话 ， 则 只 需 在 链接 天 的 命令 行 中 指定 几 个 库 文件 就 可 以 了 。 

通过 以 目标 文件 的 形式 或 集合 多 个 目标 文件 的 库 文件 形式 来 提供 
呐 数 ， 束 可 以 不 用 公开 标准 函数 的 源 代码 内 容 。 由 于 标准 函数 的 源 代 
码 是 编 详 希 厂 商 的 贵重 财产 ， 因 此 乔 被 其 他 公司 任意 转 用 的 话 ， 可 能 
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会 造成 一 些 损失 。 


转 s.6 DLL 文件 及 导入 库 

Windows 以 函数 的 形式 为 应 用 提供 了 各 种 功能 。 这 些 形式 的 函数 
称 为 API ( Application Programming Interface， 应 用 程序 接口 )。 例 如 ， 
Samplel.c 中 调用 的 MessageBox()， 它 并 不 是 C 话 言 的 标准 困 数 ， 而 是 
Windows 提供 的 API 的 一 种 。MessageBox0 提供 了 显示 消息 框 的 功能 。 


Windows 中 ，API 的 目标 文件 ， 并 不 是 存储 在 通常 的 库 文 件 中 ， 而 
是 存储 在 名 为 DLL ( Dynamic Link Library ) 文件 的 特殊 库 文件 中 。 就 如 
Dynamic 这 一 名 称 所 表示 的 那样 ，DLL 文件 是 程序 运行 时 动态 结合 的 
文件 。 在 前 面 的 介绍 中 ， 我 们 提 到 MessageBox( 的 目标 文件 是 存储 在 
import32.lib 中 的 。 实 际 上 ，import32.lib 中 仅仅 存储 着 两 个 信息 ， 一 是 
MessageBox() 在 user32.dll 这 个 DLL 文件 中 ， 男 一 个 是 存储 着 DLL 文 
件 的 文件 夹 信 息 ， MessageBox() 的 目标 文件 的 实体 实际 上 并 不 存在 。 
我 们 把 类 似 于 import32.lib 这 样 的 库 文件 称 为 导入 库 。 


与 此 相反 ， 存 储 春 目 标 文 件 的 实体 ， 并 百 接 和 了 EXE 文件 结合 的 库 
文件 形式 称 为 静态 链接 库 。 毅 态 (static = 静态 的 ) 同 动态 ( dynamic = 
动态 的 ) 是 相反 的 意思 。 存 储 着 sprintf0 的 目标 文件 的 cw32lib 就 是 静 
态 链 接 库 。sprintfg) 提供 了 通过 指定 格式 把 数值 转换 成 字符 串 的 功能 。 

通过 结合 导入 库 文件 ， 执 行 时 从 DLL 文件 中 调 出 的 MessageBox() 
水 数 这 一 信息 就 会 和 EXE 文件 进行 结合 。 这 样 ， 链 接 带 链接 时 就 不 会 
再 出 现 错误 消 恩 ， 从 而 就 可 以 顺利 编写 EXE 文件 。 


至 此 ， 我 们 总 结 一 下 Windows 中 的 编译 及 链接 机 制 ， 如 图 8-8 
所 示 。 
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目标 文件 
Sample1.ob] 


存储 在 CNBorlandNocc55Nib 
CUWS2wob| 


sprintf() 的 
目标 文件 


MessageBox ( ) 可 执行 文件 
的 目标 文件 sdmplelsexe 


图 8-8 Windows 中 的 编译 和 链接 机 制 


8.7 ”可 执行 文件 运行 时 的 必要 条 件 

在 了 解 了 通过 程序 的 编译 及 链接 来 生成 EXE 文件 的 机 制 后 ， 接 下 
来 看 一 下 EXE 文件 的 运行 机 制 。EXE 文件 是 作为 单独 的 文件 储存 在 硬 
盘 中 的 。 通 过 人 欣 源 管理 天 找到 并 双击 EXE 文件 ， 就 会 把 EXE 文件 的 内 
容 加 载 到 内 存 中 运行 。 
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请 大 家 思考 一 下 下 面 的 问题 。 本 地 代码 在 对 程序 中 记述 的 变量 进 
行 读 写 时 ， 是 参照 数据 存储 的 内 存 地 址 来 运行 命令 的 。 在 调用 函数 时 ， 
程序 的 处 理 流程 就 会 跳 转 到 存储 着 函数 处 理 内 容 的 内 存 地 址 上 。EXE 


文件 作为 本 地 代码 的 程序 ， 并 没有 指定 变量 及 函数 的 实际 内 存 地 址 。 
在 类 似 于 Windows 操作 系统 这 样 的 可 以 加 载 多 个 可 执行 程序 的 运行 环 
境 中 ， 每 次 运行 时 ,程序 内 的 变量 及 函数 被 分 配 到 的 内 存 地 址 都 是 不 
同 的 。 那 么 ， 在 EXE 文件 中 ， 变 量 和 函数 的 内 存 地 址 的 值 ， 是 如 何 来 
表示 的 呢 ? 


下 面 驶 让 我 们 来 揭晓 答案 。 那 就 是 EXE 文件 中 给 变量 及 消 数 分 配 
了 虚拟 的 内 存 地 址 。 在 程序 运行 时 ， 虚 拟 的 内 存 地 址 会 转换 成 实际 的 
内 存 地 址 。 链 接 和 可 会 在 EXE 文件 的 开头 ， 退 加 转换 内 存 地址 所 需 的 必 
要 信息 。 这 个 信息 称 为 再 配置 信息 。 


EXE 文件 的 再 配置 信息 ， 束 成 为 了 变量 和 函数 的 相对 地 址 。 相 对 
地 址 表示 的 是 相对 于 基点 地 址 的 偏 移 量 ， 也 就 是 相对 距离 。 实 现 相对 
地 址 ， 也 是 需要 花费 一 番 心 思 的 。 在 源 代码 中 ,虽然 变量 及 函数 是 在 
不 同位 置 分 散记 述 的 ， 但 在 链接 后 的 EXE 文件 中 ， 变 量 及 函数 就 会 变 
成 一 个 连续 排列 的 组 。 这 样 一 来 ， 各 变量 的 内 存 地 址 就 可 以 用 相对 于 
变量 组 起 始 位 置 这 一 基点 的 侦 移 量 来 表示 ， 同 样 ， 各 函数 的 内 存 地 址 
也 可 以 用 相对 于 权 数 组 起 始 位 置 这 一 基点 的 偏 移 量 来 表示 。 而 各 组 基 
点 的 内 存 地 址 则 是 在 程序 运行 时 被 分 配 的 (图 8-9 )。 
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变量 组 的 基点 


移 量 


函数 组 的 基点 


偏 移 量 
函数 ( 处 理 ) 组 


图 8-9 ”链接 后 的 EXE 文件 的 构造 


团 3.8 程序 加 载 时 会 生成 本 和 堆 

EXE 文件 的 内 容 分 为 再 配置 信息 、 变 量 组 和 函数 组 ， 这 一 点 想必 
大 家 都 清楚 了 吧 。 不 过 ， 当 程序 加 载 到 内 存 后 ， 除 此 之 外 还 会 额外 生 
成 两 个 组 ， 那 就 是 栈 和 堆 。 栈 是 用 来 存储 函数 内 部 临时 使 用 的 变量 (局 
部 变量 “)， 以 及 函数 调用 时 所 用 的 参数 的 内 存 区 域 。 堆 是 用 来 存储 程 
序 运行 时 的 任意 数据 及 对 象 的 内 存 领域 ( 图 8-10 )。 


EXE 文件 中 并 不 存在 栈 及 堆 的 组 。 栈 和 堆 需 要 的 内 存 空 间 是 在 
EXE 文件 加 载 到 内 存 后 开始 运行 时 得 到 分 配 的 。 因 而 ， 内 存 中 的 程序 ， 
就 是 由 用 于 变量 的 内 存 空 间 、 用 于 函数 的 内 存 空间 、 用 于 栈 的 内 存 空 
间 、 用 于 堆 的 内 存 空间 这 4 部 分 构成 的 。 当 然 ， 在 内 存 中 ， 加 载 
Windows 等 操作 系统 的 内 存 空间 又 是 男 外 一 回 事 了 (图 8-10 )。 


QD 局 部 变量 是 指 只 在 调用 函数 时 存在 于 内 存 中 的 变量 。 例 如 ， 在 代码 清单 8-1 
中 ，WinMain 函数 的 处 理 中 的 ave 和 buff 都 是 局 部 变量 。 全 局 变量 是 指 程 
序 运行 时 一 直 存 在 于 内 存 中 的 变量 。 代 码 清单 8-1 中 的 title 就 是 全 局 变量 。 
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内 存 


用 于 操作 系统 的 空间 


复制 EXE 文 件 
1 个 程序 了 使 用 
的 内 存 空间 
程序 运行 时 申请 分 配 


. 图 8-10 加 载 到 内 存 的 程序 由 4 部 分 构成 


栈 及 堆 的 相似 之 处 在 于 ， 他 们 的 内 存 空间 都 是 在 程序 运行 时 得 到 
申请 分 配 的 “。 不过， 在 内 存 的 使 用 方法 上 ， 二 者 存在 些许 不 同 。 栈 中 
对 数据 进行 存储 和 舍弃 ( 清理 处 理 ) 的 代码 ， 是 由 编译 器 自动 生成 的 ， 
因此 不 需要 程序 员 的 参与 。 使 用 栈 的 数据 的 内 存 空间 ， 每 当 函 数 被 调 
用 时 都 会 得 到 申请 分 配 ， 并 在 函数 处 理 完毕 后 自动 释放 。 与 此 相对 ， 
堆 的 内 存 空间 ， 则 要 根据 程序 员 编写 的 程序 ， 来 明确 进行 申请 分 配 或 
释放 。 


J 不 管 是 什么 程序 ， 程 序 的 内 容 都 是 由 处 理 和 数据 构成 的 。 大 多 数 编程 语言 
都 是 用 函数 来 表示 处 理 、 用 变量 来 表示 数据 。 

@) 栈 和 堆 的 大 小 ， 可 以 由 程序 员 任 意 指 定 。 在 高 级 编程 语言 中 ， 编 译 器 会 自 
动 生 成 指定 栈 和 扒 大 小 的 代码 ， 并 将 其 附加 到 程序 中 。 
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根据 编程 语言 的 不 同 ， 对 堆 用 的 内 存 空间 进行 申请 分 配 和 释放 的 
程序 的 编写 方法 也 是 多 种 多 样 的 。C 语言 中 是 通过 malloc() 顺 数 来 进行 
申请 分 配 、 通 过 free0 函数 来 释放 的 。 而 C++ 中 则 是 通过 new 运算 符 
来 申请 分 配 、 通 过 delete 运算 符 来 释放 的 。 无 论 是 C 语言 还 是 C++， 
如 果 没 有 在 程序 中 明确 释放 堆 的 内 存 空间 ， 那 么 即使 在 处 理 完毕 后 ， 
该 内 存 空 间 仍 会 一 直 残 留 。 这 个 现象 称 为 内 存 泄露 ( memory leak )， 它 
是 令 C 语言 及 C++ 的 程序 员 们 十 分 头疼 的 一 个 bug〈 程序 的 错误 )。 如 
果 内 存 泄露 一 下 存在 的 话 ， 就 有 可 能 会 造成 内 存 不 足 而 导致 宕 机 。 这 
就 好 比 ， 如 果 水 龙头 一 下 咬 嘲 咬 噶 地 汤水， 那么 一 晚上 的 时 间 水 桶 就 


可 能 会 装 满 并 溢出 。 


国 8.9 有 点 难度 的 O&A 

Q : 编译 器 和 解释 器 有 什么 不 同 ? 

A : 编译 器 是 在 运行 前 对 所 有 源 代 码 进行 解释 处 理 的 。 而 解释 器 则 
是 在 运行 时 对 源 代码 的 内 容 一 行 一 行 地 进行 解释 处 理 的 。 


Q :“ 分 割 编译 ” 指 的 是 什么 ? 

A : 将 整个 程序 分 为 多 个 源 代码 来 编写 ， 然 后 分 别 进行 编译 ， 最 后 
链接 成 一 个 EXE 文件 。 这 样 每 个 源 代码 都 相对 变 短 ， 便 于 程序 管理 。 

Q :“Build” 指 的 是 什么 ? 

A : 根据 开发 工具 种 类 的 不 同 ， 有 的 编译 希 可 以 通过 选择 “Build” 
菜单 来 生成 EXE 文件 。 这 种 情况 下 ，Build 指 的 是 连续 执行 编译 和 链接 。 

Q : 使 用 DLL 文件 的 好 处 是 什么 ? 

A : DLL 文件 中 的 水 数 可 以 被 多 个 程序 共用 。 因 此 ， 借助 该 功能 6 
以 节约 内 存 和 人 磁盘。 此 外 ， 在 对 函数 的 内 容 进 行 修正 时 ， 还 不 需要 重 
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新 链接 ( 静态 链接 ) 使 用 这 个 函数 的 程序 。 


Q : 不 链接 导入 库 的 话 就 无 法 调用 DLL 文件 中 的 函数 吗 ? 

A : 通过 使 用 LoadLibrary() 及 GetProcAddress() 这 些 API， 即 使 不 
链接 导入 库 ， 也 可 以 在 程序 运行 时 调用 DLL 文件 中 的 函数 。 不 过 使 用 
导 人 库 更 简单 一 些 。 


Q :“ 到 加 链接 ”这 个 术语 指 的 是 什么 ? 

A : 将 不 会 同时 执行 的 函数 ， 交 蔡 加 载 到 同一 个 地 址 中 运行 。 通 过 
使 用 “三 加 链接 器 ”这 一 特殊 的 链接 器 即 可 实现 。 在 计算 机 中 配置 的 内 
存 容量 不 多 的 MS-DOS 时 代 ， 经 常 使 用 加 链接 。 


Q : 和 内 存 管理 相关 的 “垃圾 回收 机 制 ” 指 的 是 什么 呢 ? 

A : 垃圾 回收 机 制 ( garbage collection ) 指 的 是 对 处 理 完毕 后 不 再 需 
要 的 堆 内 存 空间 的 数据 和 对 象 ， 进 行 清理 ， 释 放 它 们 所 使 用 的 内 存 空 
间 。 这 里 把 不 需要 的 数据 比喻 为 了 垃圾 。 进 行 该 处 理 时 ，C 语言 用 的 是 
free() 国 数 ，C++ 用 的 是 delete 运算 符 。 在 C++ 的 基础 上 开发 出 来 的 
Java 及 C# 这 些 编程 语言 中 ， 程 序 运行 环境 会 自动 进行 垃圾 回收 。 这 样 
就 可 以 避免 由 于 程序 员 的 玻 包 ( 忘 了 记述 内 存 的 释放 处 理 ) 而 造成 内 存 


Q) 关于 DLL 文件 可 以 被 多 个 程序 共用 的 好 处 ， 第 5 章 中 有 详细 介绍 。 
@) 堆 中 的 object (对象 ) 不 是 object 文件 ( 目标 文件 )， 而 是 面向 对 象 编程 语 
言 的 object( 对象， 数据 和 处 理 的 集合 体 )。 
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3 热身 问答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


. 监控 程序 的 主要 功能 是 什么 ? 

. 在 操作 系统 上 运行 的 程序 称 为 什么 ? 

. 调用 操作 系统 功能 称 为 什么 ? 

. Windows Vista 是 多 少 位 的 操作 系统 ? 
. GUI 是 什么 的 缩写 ? 

. WYSIWYG 是 什么 的 缩写 ? 


OO OO 上 omP 一 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 
是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


1. 程序 的 加 载 和 运行 

2. 应 用 或 应 用 程序 

3. 系统 调用 ( system call ) 

4. 32 位 (也 有 64 位 的 版 本 ) 

5. Graphical User Interface ( 图 形 用 户 界 面 ) 

6. What You See ls What Your Get ( 所 见 即 所 得 ) 


1， 监控 程序 也 可 以 说 是 操作 系统 的 原型 。 

2， 文字 处 理 软件 和 表格 计算 软件 等 都 是 应 用 。 

3. 应 用 通过 系统 调用 ( system call ) 间接 控制 硬件 。 

4. Windows Vista 有 32 位 CPU 用 的 版 本 ,也 有 64 位 CPU 用 的 


版 本 。 
5. 显示 带 中 显示 的 窗口 及 图 标 等 通过 鼠标 点 击 可 以 十 观 操作 的 用 
户 窜 面 。 


6. WYSIWYG 是 指 可 以 直接 将 显示 器 中 显示 的 内 容 在 打印 机 上 打 
印 出 来 。 这 也 是 Windows 的 特征 之 一 。 
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利用 计算 机 运行 程序 大 部 分 都 是 为 了 提高 处 理 效 
率 。 例 如 ，Microsoft Word 这 样 的 文字 处 理 软 件 ， 是 
用 来 提高 文本 文件 处 理 效 率 的 程序 ，Microsoft Excel 等 表格 计算 软件 ， 
是 用 来 提高 账本 处 理 效 率 的 程序 。 类 似 于 文字 处 理 软 件 及 表格 计算 软 
件 这 样 ， 为 了 提高 特定 处 理 效 率 的 程序 总 称 为 “应 用 ”。 


程序 员 的 工作 就 是 编写 各 种 各 样 的 应 用 来 提高 业务 效率 。 而 应 用 
的 运行 环境 ， 也 就 是 操作 系统 ， 则 直接 从 软件 商店 等 处 购买 就 可 以 了 。 
不 过 ， 一定 不 能 忽略 操作 系统 ， 否 则 就 无 法 编写 应 用 。 这 是 因为 ， 程 
序 员 是 通过 利用 操作 系统 提供 的 功能 来 编写 应 用 的 。 本 章 中 ， 我 们 会 
对 操作 系统 的 角色 ， 以 及 应 用 利用 操作 系统 功能 的 方法 进行 说 明 。 关 
于 操作 系统 的 类 型 ， 这 里 我 们 选取 了 用 户 人 数 较 多 的 Windows 作为 
示例 。 


转 9.1 操作 系统 功能 的 历史 
首先 ， 在 简单 回顾 操作 系统 ”的 历史 的 同时 ， 我 们 来 看 一 下 操作 系 
统 到 底 是 怎样 的 软件 。 


在 计算 机 中 尚 不 存在 操作 系统 的 年 代 ， 完 全 没有 任何 程序 ， 因 此 
程序 员 束 需要 编写 出 处 理 相关 的 所 有 程序 。 用 机 各 语言 编写 程序 ， 然 
后 再 使 用 开关 将 程序 输入 ， 这 一 过 程 非常 抹 烦 。 于 是 ， 有 人 开发 出 了 
仅 具 有 加 载 和 运行 功能 的 监控 程序 ， 这 就 是 操作 系统 的 原型 。 通 过 事 
完 局 动 监控 程序 ， 程 序 员 就 可 以 根据 需要 将 各 种 程序 加 载 到 内 存 中 运 


QD 操作 系统 (Operating System ) 也 称 为 基础 软件 。 操 作 系 统 是 计算 机 运行 时 
不 可 或 缺 的 控制 程序 ， 以 及 在 控制 程序 下 运转 的 为 其 他 软件 运行 提供 操作 
环境 的 软件 的 统称 。 另 外 ， 在 操作 系统 上 运行 的 应 用 也 称 为 “应 用 程序 ”。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 @ 


行 。 虽 然 依旧 比较 麻烦， 但 比 起 在 没有 任何 程序 的 状态 下 进行 开发 ， 
工作 量 得 到 了 很 大 的 缓解 (图 9-1 )。 


1 国 


人 


随 看 时 代 的 发 展 ， 人 们 在 利用 监控 程序 编写 程序 的 过 程 中 ， 发 现 
很 多 程序 部 有 共通 的 部 分 。 例 如 ， 通 过 键盘 输入 文字 数据 、 往 显示 涡 
输出 文字 数据 等 。 这 些 处 理 ， 在 任何 程序 下 都 是 一 样 的 。 而 如 果 每 编 
写 一 个 新 的 程序 都 要 记述 相同 的 处 理 的 话 ， 那 真 的 是 太 肖 费时 间 了 。 
因此 ， 基 本 的 输入 输出 部 分 的 程序 驶 被 奶 加 到 了 监控 程序 中 。 初 期 的 
操作 系统 就 这 样 媳 生 了 ( 图 9-2 )。 


之 后 ， 随 着 时 代 的 进一步 发 展 ， 开 始 有 更 多 的 功能 被 追加 到 监控 
程序 中 ， 比 如 ， 为 了 方便 程序 员 的 硬件 控制 程序 、 编 程 语 言 处 理 器 ( 汇 
编 、 编 译 、 解 析 ) 以 及 各 种 实用 程序 等 ， 结 果 就 形成 了 和 现在 相差 不 大 
的 操作 系统 。 因 此 ， 操 作 系 统 本 号 并 不 是 单独 的 程序 ， 而 是 多 个 程序 
的 集合 体 ( 图 9-3 )。 
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监控 程序 的 功能 
监控 程序 ( 1 ) 加 载 程序 
( 2 ) 运行 程序 


| [| 
基本 的 输入 

输出 程序 基本 的 输入 输出 程序 的 功能 
一 | ( 1 ) 通过 键盘 输入 


( 2 ) 输出 到 显示 器 等 


”图 9-2 ”初期 的 操作 系统 = 监控 程序 + 基本 的 输入 输出 程序 


操作 系统 
控制 程序 编程 语言 处 理 器 实用 程序 
硬件 控制 > 文本 编辑 器 
程序 运行 控制 i 调试 工具 
Dump 程 序 


图 9-3 ”操作 系统 是 多 个 程序 的 集合 体 


9.2 ”要 意识 到 操作 系统 的 存在 

这 里 ， 我 布 望 制 作 应 用 的 程序 员 们 意识 到 一 点 ， 那 就 是 你 们 制作 
的 不 是 人 硬件， 而 是 利用 操作 系统 功能 的 应 用 。 虽 然 对 程序 员 来 说 ， 和 车 
握 便 件 的 基本 知识 是 必需 的 ， 不 过 ， 在 操作 系统 诞生 以 后 ， 驶 没有 
必要 再 编写 百 接 控制 便 件 的 程序 了 。 这 样 一 来 ， 制 作 应 用 的 程序 员 
就 逐渐 问 便 件 隔 离开 来 了 。 也 如 是 说 ， 程 序 员 是 很 少 关注 现实 世界 
( 便 件 ) 的 。 
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由 于 操作 系统 诞生 后 ， 程 序 员 无 需 再 考虑 便 件 的 问题 ， 因 此 程序 
员 的 数量 也 增加 了 。 哪 伯 是 目 称 “对 人 硬件 一 翁 不 通 ” 的 人 ， 也 可 能 会 制 
作出 一 个 有 模 有 样 的 应 用 。 不 过 ， 要 想 成 为 一 个 全 面 的 程序 员 ， 有 一 
扩 需 要 清楚 的 是 ， 掌 握 基 本 的 便 件 知识 ， 并 借助 操作 系统 进行 抽象 化 ， 
可 以 大 大 提高 编程 效率 。 人 否则 ， 遇 到 问题 时 ， 你 就 无 法 找到 解决 办 法 。 
操作 系统 确实 为 程序 员 提 供 了 很 多 方便 。 不 过 ， 仪 仅 台 受 方便 是 不 行 


的 ， 还 要 了 解 为 什么 目 己 能 够 这 么 方便 。 了 解 了 这 一 点 ， 就 可 以 尽情 
地 至 受 方便 了 。 


下 面 就 来 看 一 下 操作 系统 是 如 何 给 开发 人 员 带 来 便利 的 。 代 码 清 
单 9-1 表示 的 是 ， 在 Windows 操作 系统 下 ,用 C 语言 制作 一 个 具有 表 
示 当 前 时 间 功 能 的 应 用 。time( 是 用 来 取得 当前 日 斯 和 时 间 的 函数 ， 
printf() 是 用 来 在 显示 带 上 显示 字符 串 的 也 数 。 程 序 的 运行 结果 如 图 9-4 
所 示 。 


代码 清单 9-1 表示 当前 时 间 的 应 用 


ta lle el 
#include <time.h> 


vo main(l)o dl 
// 保存 当前 日 期 和 时 间 信 息 的 变量 


eonme 起 en, 


// 取得 当前 的 日 期 和 时 间 


time (Stm) ; 


// 在 显示 器 上 显示 日 期 和 时 间 


BrimeE (SS\nn, GETmSs(EE) ); 
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图 9-4 ”代码 清单 9-1 的 运行 结果 


运行 代码 清单 9-1 的 应 用 时 ， 硬 件 的 受 探 过 程 如 下 所 示 。 


(1 ) 通过 tme ttm;， 为 time t 类 型 的 变量 申请 分 配 内 存 空间 。 
(2 ) 通过 time(&tm);， 将 当前 的 日 期 和 时 间 数 据 保存 到 变量 的 内 


存 空间 中 。 
(3 ) 通过 printff"%sm",ctime(&tm));， 把 变量 内 存 空间 的 内 容 输出 
到 显示 硕 上 。 


应 用 的 可 执行 文件 指 的 是 ， 计 算 机 的 CPU 可 以 直接 解释 并 运行 的 
本 地 代码 。 不 过 这 些 代 码 是 无 法 直接 控制 计算 机 中 配置 的 时 钟 IC 及 显 
示 需 用 的 IO 等 便 件 的 。 那 么 ， 为 什么 代码 清单 9-1 的 应 用 能 够 控制 硬 
件 呢 ? 


在 操作 系统 这 个 运行 环境 下 ， 应 用 并 不 是 直接 控制 硬件 ， 而 是 通 
过 操作 系统 来 间接 控制 硬件 的 。 变 量 定义 中 涉及 的 内 存 的 申请 分 配 ， 
以 及 time0 和 printf0 这 些 函 数 的 运行 结果 ， 都 不 是 面向 硬件 而 是 面 
向 操作 系统 的 。 操 作 系统 收 到 应 用 发 出 的 指令 后 ， 首 先 会 对 该 指令 进 
行 解释 ， 然 后 会 对 时 钟 IC ( 实时 时 钟 “) 和 显示 器 用 的 IO 进行 控制 。 


(D 计算 机 中 都 安装 有 保存 日 期 和 时 间 的 实时 时 钟 (Real-time clock )。 本 节 中 
提 到 的 时 钟 IC 就 是 指 该 实时 时 钟 。 
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软件 


应 用 程序 | 


县 利用 OS 的 功能 
有 操作 系统 的 基本 的 输入 输出 程序 | 


| 控制 硬件 
实时 时 钟 | 时 示 吕 用 的 /O | 


硬件 


图 9-5 ”应 用 程序 经 过 OS 间接 地 控制 硬件 


9.3 ”系统 调用 和 高 级 编程 语言 的 移植 性 

操作 系统 的 硬件 控制 功能 ， 通 党 是 通过 一 些小 的 函数 集合 体 的 形 
式 来 提供 的 。 这 些 晒 数 及 调用 图 数 的 行为 统称 为 系统 调用 ( System 
call )， 也 就 是 应 用 对 操作 系统 ( system ) 的 功能 进行 调用 ( call ) 的 意 
思 。 在 前 面 的 程序 中 用 到 了 time0 及 printfl) 等 函数 ， 这 些 函 数 内 部 也 
都 使 用 了 系统 调用 。 这 里 之 所 以 用 “内 部 ”这 个 词 ， 是 因为 在 Windows 
操作 系统 中 , 提供 返回 当前 日 期 和 时 刻 ， 以 及 在 显示 需 中 显示 字符 串 等 
功能 的 系统 调用 的 函数 名 ， 并 不 是 time() 和 printt)。 系 统 调用 是 在 
time() 和 printf() 函数 的 内 部 执行 的 。 大 家 可 能 会 认为 这 个 方法 有 些 绕 ， 
不 过 这 是 有 原因 的 。 


C 语言 等 高 级 编程 语言 并 不 依存 于 特定 的 操作 系统 。 这 是 因为 人 们 
希望 不 管 是 Windows 还 是 Linux， 都 能 使 用 几乎 相同 的 源 代码 。 因 此 ， 
局 级 编程 语言 的 机 制 就 是 ， 使 用 独自 的 函数 名 ,然后 再 在 编译 时 将 其 
转换 成 相应 操作 系统 的 系统 调用 ( 也 有 可 能 是 多 个 系统 调用 的 组 合 )。 
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也 驶 是 说 ， 用 高 级 编程 语言 编写 的 应 用 在 编译 后 ， 就 转换 成 了 利用 系 
统 调 用 的 本 地 代码 ( 图 9-6 )。 


高 级 编程 语言 程序 本 地 代码 程序 
i 在 Windows 环 境 下 编译 Windows 的 系统 调用 
em Windows 的 系统 调用 


Linux 的 系统 调用 
Linux 的 系统 调用 
在 Linux 环 境 下 编译 


”图 9-6 ”高 级 编程 语言 的 函数 调用 在 编译 后 变 成 了 系统 调用 


在 高 级 编程 语言 中 ， 也 存在 可 以 直接 调用 系统 调用 的 编程 语言 。 
不 过 ， 利 用 这 种 方式 做 成 的 应 用 ， 移 植 性 ”并 不 友好 ( 也 俗称 为 有 恶意 
行为 的 应 用 ) 例如 ， 直 接 调 用 Windows 系统 调用 的 应 用 ， 在 Linux 上 
显然 是 无 法 运行 的 。 


国 9.4 操作 系统 和 高 级 编程 语言 使 硬件 抽象 化 

通过 使 用 操作 系统 提供 的 系统 调用 ， 程 序 员 就 没 必 要 编写 直接 控 
制 硬 件 的 程序 了 。 而 且 ， 通 过 使 用 高 级 编程 语言 ， 有 了 时 甚至 也 无 需 考 
虑 系统 调用 的 存在 。 这 是 因为 操作 系统 和 高 级 编程 语言 能 够 使 硬件 抽 
象 化 。 这 是 个 非常 了 不 起 的 处 理 。 

下 面 就 让 我 们 来 看 一 下 硬件 抽象 化 的 具体 实例 。 代 码 清单 9-2 是 用 
C 语言 编写 的 往 文件 中 写 入 字符 串 的 应 用 。fopen0 是 用 来 打开 文件 的 


JJ 移植 性 指 的 是 同样 的 程序 在 不 同 操作 系统 下 运行 时 需要 花费 的 时 间 等 ， 费 
时 越 少 说 明 移 植 性 越 好 。 
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卫 效 ，fputs0 是 用 来 往 文件 中 写 入 字符 串 的 函数 ，fclose() 是 用 来 关闭 
文件 的 函数 。 
代码 清单 9.2， 往 文件 中 写 入 字符 串 的 应 用 


Hvacenbuelenms Eon 


vold main( al 
7 


ID lo Ss EODGn (MillLe. EXE Wu)y 


// 写 入 文件 
FEB (Ms 


// 关闭 文件 
fclose (fp),; 


该 应 用 在 编译 运行 后 ，MyFile.txt 文件 中 就 会 被 写 人 “你 好 ”字符 
串 。 文 件 是 操作 系统 对 磁盘 媒介 空间 的 抽象 化 。 就 如 第 $ 章 中 介绍 
的 那样 ， 作 为 便 件 的 磁盘 妹 介 ， 束 如 同 树木 的 年 轮 一 样 ， 被 划分 为 了 
多 个 虱 区 ， 并 以 面 区 为 单位 对 磁盘 进行 读 写 。 如 果 直 接 对 硬件 进行 
操作 的 话 ， 那 就 变 成 了 通过 回 磁 盘 用 的 IO 指定 局 区 位 置 来 对 数据 
进行 谈 写 了 5 

但 是 ， 在 代码 清单 9-2 的 程序 中 ， 忆 区 根本 没有 出 现 过 。 传 递 给 
fopeng 函数 的 参数 ， 是 文件 名 "MyFile.txt" 和 指定 文件 写 人 的 "w"。 传 
递 给 fputs( 的 参数 ， 是 往 文件 中 写 入 的 字符 串 " 你 好 " 和 印 。 传 递 给 
fclose 的 参数 ， 也 仅仅 是 二。 也 就 是 说 ,磁盘 媒介 的 读 写 采用 了 文件 这 
个 概念 ， 将 整个 流程 抽象 化 成 了 打开 文件 用 的 fopen0、 写 人 文件 用 的 
fputsO0 、 关 闭 文件 用 的 fcloseO (图 9-7 )。 


fopen0O、fputsO、fclose0 这 些 函 数 名 分 别 是 fie open、 file put string、file 
close 的 略称 。string 是 字符 串 的 意思 。 
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fopen、fputs、fclose 


图 9-7 物理 上 的 磁盘 媒体 被 抽象 化 成 了 文件 


下 面 让 我 们 来 看 一 下 代码 清单 9-2 中 变量 亡 的 功能 。 变 量 户 中 被 
赋予 的 是 fopen0 函数 的 返回 值 。 该 值 称 为 文件 指针 。 应 用 打开 文件 
后 ， 操 作 系 统 就 会 日 动 申请 分 配 用 来 管理 文件 读 写 的 内 存 空 间 。 这 个 
内 存 空间 的 地 址 可 以 通过 fopen0 函数 的 返回 值 获得 。 用 fopen0 打开 文 
件 后 ， 接 下 来 就 是 通过 指定 文件 指针 来 对 文件 进行 操作 。 正 因为 如 此 ， 
fputs() 及 fclose0 的 参数 中 都 指定 了 文件 指针 ( 变量 p )。 


至 于 用 来 管理 文件 读 写 的 内 存 空间 的 内 容 实 际 在 哪里 ， 程 序 员 则 
没 必要 关注 。 只 要 能 意识 到 “用 来 操作 磁盘 巡 介 的 某 些 信息 在 菜 个 地 方 
存储 着 ”， 就 可 以 制作 应 用 了 。 


圈 9.5 Windows 操作 系统 的 特征 

考虑 到 大 多 数 读者 使 用 的 都 是 Windows 操作 系统 ， 这 里 我 们 就 以 
Windows 为 例 ， 来 详细 讲解 操作 系统 的 具体 功能 。Windows 操作 系统 
的 主要 特征 如 下 所 示 。 


(1 ) 32 位 操作 系统 (也 有 64 位 版 本 ) 
(2 ) 通过 API 吨 数 集 来 提供 系统 调用 
(3 ) 提供 采用 了 图 形 用 户 界 面 的 用 户 界 面 
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(4) 通 过 WYSIWYG 实现 打印 输出 

(5 ) 提供 多 任务 功能 

(6 ) 提供 网 络 功能 及 数据 库 功 能 

(7 ) 通过 即 揪 即 用 实现 设备 驱动 的 自动 设 定 


这 里 只 列 出 了 对 程序 员 有 意义 的 一 些 特 征 。 接 下 来 将 依次 对 
Windows 操作 系统 的 特征 ， 以 及 其 对 编程 的 影响 进行 说 明 。 


( 1 ) 32 位 操作 系统 

虽然 现在 的 Windows 也 有 64 位 版 本 ,但 一 般 广 泛 普及 的 还 是 32 
位 版 本 。 这 里 的 32 位 表示 的 是 处 理 效率 最 高 的 数据 大 小 。Windows 处 
理 数据 的 基本 单位 是 32 位 。 习 惯 在 以 前 的 MS-DOS 等 16 位 操作 系统 
下 编程 的 程序 员 ， 可 能 不 太 愿 意 使 用 32 位 的 数据 类 型 。 因 为 他 们 认为 
处 理 32 位 的 数据 ， 要 比 处 理 16 位 的 数据 更 花 时 间 。 确 实 , 在 16 位 操 
作 系 统 中 处 理 32 位 的 数据 时 ， 因 为 要 处 理 两 次 16 位 的 数据 ， 所 以 会 
多 花 一 些 时 间 。 而 如 果 是 32 位 操作 系统 的 话 ， 那 么 只 需要 1 次 就 可 以 
完成 32 位 的 数据 的 处 理 了 。 所 以 说 ， 几 是 在 Windows 上 运行 的 应 用 ， 
都 可 以 训 无 顾虑 地 尽 可 能 地 使 用 32 位 的 数据 。 


例如 ， 用 C 语言 来 处 理 整 数 数据 时 ， 有 8 位 的 char 类 型 、16 位 的 
short 类 型 ， 以 及 32 位 的 long 类 型 (还 有 int 类 型 ) 三 个 选项 。 使 用 位 
数 大 的 long 类 型 的 话 ， 虽 然 内 存 及 磁盘 的 开销 较 大 ， 但 应 用 的 运行 速 
度 并 不 会 下 降 。 这 在 其 他 编程 语言 中 也 是 同样 的 。 


(JWYSIWYG 是 What You See Is What You Get 的 略 写 。 意 思 是 ， 显 示 器 上 显 
示 的 文本 及 图 形 等 (What You See )， 是 (Is ) 可 以 原样 输出 到 打印 机 上 打印 
(What You Get ) 的 。 
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(2 ) 通 过 API 函数 集 来 提供 系统 调用 

Windows 是 通过 名 为 API 的 函数 集 来 提供 系统 调用 的 。API 是 联 
系 作 成 应 用 的 程序 员 和 操作 系统 之 间 的 接口 。 所 以 称 为 API 
( Application Programming Interface， 应 用 程序 接口 )。 


当前 主流 的 32 位 版 Windows API 也 称 为 Win32 API。 之 所 以 这 样 
命名 ， 是 为 了 便于 和 以 前 的 16 位 版 的 Win16 API， 以 及 更 先进 的 64 位 
版 的 Win64 API 区 分 开 来 。Win32 API 中 ， 各 函数 的 参数 及 返回 值 的 数 
据 大 小 ， 基 本 上 都 是 32 位 。 


API 通过 多 个 DLL 文件 来 提供 。 各 API 的 实体 都 是 用 C 语言 编写 
的 函数 。 因 而 ，C 语言 程序 的 情况 下 ，AP 的 使 用 更 加 容易 。 截 至 到 现 
在 ， 本 书 示 例 程 序 中 用 到 的 API 中 都 有 MessageBox()。MessageBox() 
被 保存 在 Windows 提供 的 user32.dll 这 个 DLL 文件 中 。 


( 3 ) 提供 采用 了 GUI 的 用 户 界 面 


GUI ( Graphical User Interface， 图 形 用 户 界 面 ) 指 的 是 通过 点 击 显 
示 需 中 显示 的 窗口 及 图 标 等 即 可 进行 可 视 化 操作 的 用 户 界面 。 对 用 户 
来 说 ，GUI 是 图 形 、 鼠 标 ， 但 对 程序 员 来 说 ，GUI 并 不 仅 是 这 些 。 这 
是 因为 想 要 作成 一 个 实现 GUI 的 应 用 ， 并 不 是 一 件 容易 的 事情 。 曾 经 
有 一 首 佛 句 是 这 样 的 :“GUI， 用 的 时 候 是 天 符 ， 做 的 时 候 是 地 狱 ”， 大 
家 可 以 想象 它 的 难度 了 吧 。 


之 所 以 这 样 困难 ， 是 因为 在 GUI 中 用 户 按 照 怎 样 的 顺序 操作 是 无 
法 确定 的 。 例 如 ， 图 9-8 是 Web 浏览 介 (Internet Explorer 7 ) 的 一 个 窄 
口 。 通 过 多 个 标签 页 的 切换 ， 束 可 以 进行 各 种 项 目 设 定 。 从 Web 浏览 
种 的 用 户 角 度 来 次 ， 这 样 的 窗口 不 仅 使 用 方便 ， 操 作 也 人 简单， 但 对 负 
责 开 发 的 程序 员 来 说 ， 却 决 不 是 简单 的 事情 。 
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@ 从 上 次 会 话 中 的 选项 卡 开始 B) 

回 从 主页 开始 00 
选项 ”一 一 

更 改 网 页 在 选项 卡 中 的 显示 方式 。 
浏览 历史 记录 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
量 除 临时 文件 、 历 史记 录 、Coskie、 保存 的 密码 和 网 页 表单 信息 。 
加 退出 时 是 除 浏览 历史 记录 0 


和 一 一 


医生 二 sa [取消 sa | 上 用 ww | 


图 9-8 用 户 可 以 按照 任意 顺序 来 操作 窗口 的 任意 元 素 


在 像 MS-DOS 这 种 没有 使 用 GUI 的 操作 系统 中 ， 应 用 的 处 理 流程 
由 程序 员 决 定 ， 用 户 按 照 定 好 的 流程 来 进行 操作 即 可 。 与 此 相反 ， 采 
用 GUI 的 操作 系统 中 运行 的 应 用 ， 则 是 由 用 户 决 定 处 理 流程 的 。 因 此 ， 
程序 员 就 必须 要 制作 出 在 任何 操作 顺序 下 都 能 运行 的 应 用 。 这 就 要 求 
以 前 的 程序 员 要 改变 观念 。 这 就 是 GUI 的 难点 。 如 果 程 序 员 最 初 接触 
的 操作 系统 就 是 Windows 的 话 ， 那 他 或 许 会 认为 GUI 是 理所当然 的 。 


(4 ) 通 过 WYSIWYG 实现 打印 输出 

WYSIWYG 指 的 是 显示 需 上 显示 的 内 容 可 以 直接 通过 打印 机 打印 
输出 。 在 Windows 中 ， 显 示 需 和 打印 机 是 被 作为 同等 的 图 形 输出 设备 
处 理 的 ， 而 该 功能 也 就 为 WYSIWYG 的 实现 提供 了 条 件 。 


借助 WYSIWYG 功能 ， 程 序 员 可 以 轻松 不 少 。 最 初 ， 为 了 实现 在 
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显示 硕 中 显示 和 在 打印 机 中 打印 ， 就 必须 分 别 编写 各 目的 程序 。 而 在 
Windows 中 ,借助 WYSIWYG 功能 ， 基 本 上 在 同一 个 程序 中 就 可 以 实 
现 显示 和 打印 这 两 方面 的 操作 了 ( 当然 ,也 可 以 将 显示 和 打印 的 内 容 放 
在 不 同 的 程序 中 处 理 )。 


(5 ) 提供 多 任务 功能 
多 任务 指 的 是 同时 运行 多 个 程序 的 功能 。Windows 是 通过 时 钟 分 


割 技术 来 实现 多 任务 功能 的 。 


时 钟 分 割 指 的 是 在 短 时 间 间 隔 内 ， 多 个 程序 切换 运行 的 方式 。 在 
用 户 看 来 ， 就 是 多 个 程序 在 同时 运行 。 也 就 是 说 ，Windows 会 自动 切 
换 多 个 程序 的 运行 (图 9-9 )。 此 外 ，Windows 中 还 具有 以 程序 中 的 函 
数 为 单位 来 进行 时 钟 分 割 的 多 线程 ”功能 。 


和 ~、 


在 用 户 看 来 ， 这 些 程 序 
都 是 在 同时 运行 的 


图 9-9 ”通过 时 钟 分 割 实现 多 任务 的 机 制 


(6 ) 提供 网 络 功能 及 数据 库 功能 

Windows 中 ， 网 络 功 能 是 作为 标准 功能 提供 的 。 数 据 库 ( 数据 库 服 
务 右 ) 功能 有 时 也 会 在 之 后 进行 退 加 。 网 络 功能 和 数据 库 功 能 ， 虽 并 不 
是 操作 系统 本 里 不 可 欠缺 的 功能 ,但 因为 它们 和 操作 系统 很 接近 ， 所 


(DD 关于 多 线程 ， 我 们 会 在 第 10 章 进 行 说 明 ， 
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以 被 统称 为 中 间 件 而 不 是 应 用 。 意 思 是 处 于 操作 系统 和 应 用 的 中 间 
(middle )。 操 作 系 统 和 中 间 件 合 在 一 起 ， 也 称 为 系统 软件 。 应 用 不 仅 可 
以 利用 操作 系统 ， 也 可 以 利用 中 间 件 的 功能 (图 9-10 )。 


局 月 
上 利用 功能 | 


操作 系统 | Ba | 


系统 软件 


EE 


相对 于 操作 系统 一 旦 安 竣 了 驶 不 能 轻易 蔡 换 ， 中 间 件 则 可 以 根据 需 
要 进行 任意 的 蔡 换 。 不 过 ， 大 多 数 情况 下 ， 中 间 件 变更 后 应 用 往往 也 
需要 变更 ， 因 此 中 间 件 的 变更 也 不 是 那么 容易 。 
(7 ) 通过 即 插 即 用 实现 设备 驱动 的 自动 设 定 

即 插 即 用 ( Plug-and-Play ) 指 的 是 新 的 设备 连接 (Plug ) 后 立刻 驶 
可 以 使 用 ( Play ) 的 机 制 。 新 的 设备 连接 到 计算 机 后 ， 系 统 就 会 月 动 安 
效 和 设 定 用 来 控制 该 设备 的 设备 驱动 程序 。 


设备 驱动 是 操作 系统 的 一 部 分 ， 提 供 了 同 硬件 进行 基本 的 输入 输 
出 的 功能 。 键 盘 、 鼠 标 、 显 示 器 、 磁 盘 装置 等 ， 这 些 计算 机 中 必 备 的 
硬件 的 设备 驱动 ， 一 般 都 是 随 操作 系统 一 起 安装 的 。 如 果 之 后 再 追加 
新 的 网 卡 ( NIC ) 等 硬件 的 话 ， 就 需要 向 操作 系统 追加 该 硬件 专用 的 设 


(DD NIC (Network Interface Card ) 是 计算 机 连接 网 络 (LAN ) 时 使 用 的 设备 。 
也 称 为 网 卡 或 者 LAN 卡 。 
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备 驱动 。 大 家 购买 的 新 的 硬件 设备 中 ， 通 般 都 会 附带 春 软盘 或 CD- 
ROM， 里 面 通常 都 收录 着 该 便 件 的 设备 驱动 。 


有 时 DLL 文件 也 会 同 设 备 驱 动 文件 一 起 安装 。 这 些 DLL 文件 中 存 
储 看 用 来 利用 该 新 奶 加 便 件 的 API ( 天 数 集 )。 通 过 API， 可 以 制作 出 
运用 该 新 使 件 的 应 用 。 


可 以 任意 追加 设备 驱动 和 API 的 机 制 使 Windows 操作 系统 变 得 非 
第 灵活 。 这 里 所 说 的 灵活 ， 是 指 可 以 事后 再 对 新 妃 加 的 便 件 进行 处 理 。 


本 章 中 ， 为 了 明确 区 分 应 用 和 操作 系统 ， 在 解说 的 过 程 中 ， 当 遇 
到 想 用 “这 个 程序 ……” 来 表达 的 地 方 时 ， 我 们 特意 使 用 了 “这 个 应 
用 ……”。 这 是 因为 ， 程 序 是 操作 系统 、 中 间 件 、 应 用 等 所 有 软件 的 统 
称 。 因 此 ， 通 音程 序 员 制作 的 应 该 都 是 应 用 ， 而 不 是 操作 系统 。 不 过 ， 
既然 是 应 用 ， 那 么 就 肯定 会 通过 有 茶 种 形式 来 利用 操作 系统 的 功能 。 程 
序 员 一 定 要 注意 到 这 一 点 。 例 如 ， 如 果 应 用 没有 正常 运行 的 话 ， 那 么 
很 有 可 能 驶 不 是 便 件 的 问题 ， 而 是 操作 系统 的 使 用 方法 出 现 了 侦 差 。 
而 中 间 件 和 设备 驱动 ， 大 家 也 可 以 把 它们 看 作 是 操作 系统 的 一 部 分 。 


在 本 书 的 解说 中 ， 到 目前 为 止 ,“ 本 地 代码 ”这 个 术语 已 经 出 现 过 
很 多 次 。 假 如 能 用 本 地 代码 直接 编写 程序 的 话 ， 那 么 程序 的 运行 机 制 
想必 也 就 一 目 了 然 了 。 不 过 ,能够 直接 用 本 地 代码 编写 程序 的 人 ， 实 
际 上 并 不 多 见 。 大 家 的 普遍 做 法 都 是 使 用 汇编 语言 来 代替 本 地 代码 。 
在 接 下 来 的 下 一 章 ， 我 们 将 通过 用 汇编 语言 编写 程序 ， 来 看 一 下 程序 
的 实际 运行 机 制 。 
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器 超 喜欢 手机 的 女 高 中 生 讲 解 


操作 系统 的 作用 
笔者 : 你 有 手机 吗 ? 

女 高 中 生 : 有 了 啊 。 

笔者 : 什么 机 型 啊 ? 

女 高 中 生 : Docomo 的 最 新 版 。 
笔者 : 是 吗 ， 真 不 错 啊 ! 那么 ,你 
都 用 手机 做 什么 呢 ? 

女 高 中 生 : 当然 是 跟 好 朋友 通电 话 
了 啊 。 有 了 时候 也 会 发 邮件 、 查 查 
首 乐 会 信息 等 。 

笔者 : 这 样 啊 。 不 过 ， 手 机 也 是 电 
话 对 吧 。 为 什么 这 个 电话 能 发 邮 
件 、 查 看 音乐 会 信息 呢 ? 你 知道 
原因 吗 ? 也 就 是 说 电话 是 如 何 连 
接 互 联网 的 呢 ? 

女 高 中 生 : 因为 是 电话 ， 所 以 能 连 
接 互联 网 啊 ! 

笔者 : 这 么 说 也 没 错 ， 但 最 近 的 手 
机 并 不 是 单纯 的 电话 ， 更 像 是 具 
有 电话 功能 的 计算 机 。 因 此 ， 可 
以 把 手机 看 作 是 便携 式 计算 机 。 
女 高 中 生 : 感觉 话题 要 转 到 大 权 您 


擅长 的 领域 了 。 

笔者 : 呵呵 ， 这 不 是 挺 好 的 吗 。 计 
算 机 是 运行 程序 的 设备 ， 这 个 你 
是 知道 的 吧 ? 

女 高 中 生 : 知道 啊 。 我 用 过 计算 机 。 
笔者 : 虽然 手机 不 是 手提 电脑 ， 但 
它 里 面 也 是 有 程序 的 。 正 是 因为 
有 了 这 些 程序 ， 手 机 才 可 以 连 网 
显示 文字 和 图 片 等 也 都 是 通过 程 
序 来 实现 的 。 

女 高 中 生 : 这 个 当然 啊 ， 这 个 话题 
有 公司 局 

笔者 : ( 不 妙 …… 换 个 话题 看 看 ) 
对 了 ， 用 过 iApp 吗 ? 

女 高 中 生 : 用 过 ! 用 过 ! 通过 它 束 
可 以 在 手机 中 玩 游 戏 了 。 
笔者 :( 有 戏 有 戏 ， 那 束 从 这 里 进 
和 人 主题 吧 ) iApp 的 1 以 及 iMode 
的 i， 都 是 Internet 的 1，App 指 的 
是 Application， 就 是 应 用 。 
女 高 中 生 : 应 用 是 什么 啊 ? 
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如 果 是 你 5 
你 会 怎样 介绍 ? 


笔者 : 问 得 好 。 我 们 总 是 笼统 地 说 
程序 ， 其 实 程序 可 以 根据 功能 的 
不 同 分 为 操作 系统 和 应 用 。 

女 高 中 生 : 操作 系统 和 应 用 ? 
笔者 : iApp 中 有 各 种 游戏 对 吧 。 一 
个 游戏 程序 是 不 是 需要 具备 制定 洲 
戏 规则 的 功能 、 使 手机 按键 反应 的 
功能 、 显 示 文 字 和 图 片 的 功能 呢 ? 
女 高 中 生 : ? ? ? 

笔者 : 游戏 种 类 不 同 的 话 ， 当 然 游 
戏 的 规则 也 会 不 同 ， 不 过 按键 的 响 
应 功能 及 显示 文字 和 图 片 的 功能 在 
任何 游戏 中 都 是 相同 的 ， 没 错 吧 ? 
女 高 中 生 : 我 怎么 感觉 不 太一 样 


笔者 : 对 编写 程序 的 来 人 说 ， 是 一 样 
的 ! 明明 是 同样 的 功能 ， 可 是 如 果 
每 开发 一 个 游戏 都 要 生成 一 忆 ， 就 很 
浪费 时 间 对 吧 。 因 此 我 们 就 可 以 把 
所 有 游戏 共同 的 功能 集合 起 来 做 成 
一 个 独立 的 程序 ， 这 个 程序 就 称 为 
操作 系统 。 而 像 游戏 的 规则 这 种 各 
游戏 独 有 的 程序 ， 就 是 应 用 。 

女 高 中 生 : 程序 就 这 样 分 成 了 两 种 
类 型 了 ? 

笔者 : 对 ， 正 是 如 此 ! 手机 中 都 会 
提前 安装 上 操作 系统 。 想 要 玩 游 


戏 的 时 候 ， 只 用 下 载 游戏 程序 也 
束 是 应 用 并 安 容 到 手机 上 就 可 以 
了 。 游 戏 结 束 后 ， 应 用 就 消失 了 。 
不 过 操作 系统 足 不 会 消失 的 。 

女 高 中 生 : 额 ， 有 点 明日 ， 又 有 点 


笔者 : 那么 ， 以 计算 机 为 例 再 来 说 
明 一 下 。 在 计算 机 中 ， 程 序 同样 
分 为 操作 系统 和 应 用 。Windows 
知道 吧 。Windows 就 是 操作 系统 。 
后 面 安 次 上 的 文字 处 理 软件 及 洲 
戏 等 就 是 应 用 。 

女 高 中 生 : Windows 中 也 自 带 纸牌 
游戏 啊 。 

笔者 : 那个 是 Windows 的 附件 中 目 
之 的 应 用 ， 并 不 是 操作 系统 本 里 。 
女 高 中 生 : 咽 ……. 

笔者 : 怎么 样 ， 都 明日 了 吗 ? 
女 高 中 生 : 差不多 吧 。 
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阅读 正文 前 ， 让 我 们 先 回答 下 面 的 问题 来 热 热身 吧 。 


. 本 地 代码 的 指令 中 ， 表 示 其 功能 的 英语 缩写 称 为 什么 ? 
. 汇编 语言 的 源 代码 转换 成 本 地 代码 的 方式 称 为 什么 ? 
. 本 地 代码 转换 成 汇编 语言 的 源 代码 的 方式 称 为 什么 ? 
. 汇编 语言 的 源 文件 的 扩展 名 ,通常 是 什么 格式 ? 

. 汇编 语言 程序 中 的 段 定 义 指 的 是 什么 ? 

. 汇编 语言 的 跳 转 指令 ， 是 在 何 种 情况 下 使 用 的 ? 


OO) Ol 人 @ ND 一 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


.QSmn 


. 构成 程序 的 命令 和 数据 的 集合 组 
. 将 程序 流程 跳 转 到 其 他 地 址 时 需要 用 到 该 指令 


.汇编 语言 是 通过 利用 助 记 符 来 记述 程序 的 。 

. 使 用 汇编 右 这 个 工具 来 进行 汇编 。 

.通过 反 汇 编 ， 得 到 人 们 可 以 理解 的 代码 。 

.，.asm 是 assembler( 汇编 需 ) 的 略 写 。 

. 在 高 级 编程 语言 的 源 代 码 中 ， 即 使 指令 和 数据 在 编写 时 是 分 散 


的 ， 编 详 后 也 会 在 段 定义 中 集合 汇总 起 来 。 大 家 看 过 沪 编 语 言 
的 源 代码 后 ， 就 会 清楚 了。 


. 在 汇编 语言 中 ， 通 过 跳 转 指令 ， 可 以 实现 循环 和 条 件 分 支 。 
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笔者 在 学 生 时 代 曾 与 过 比较 C 语言 源 代码 和 汇编 
语言 源 代 码 的 报告 。 这 个 报告 的 研究 方法 是 ， 把 C 语 
言 的 各 种 语法 变换 成 汇编 语言 ， 然 后 对 这 些 内 容 进 行 调查 。 通 过 研究 ， 
笔者 对 程序 的 运行 机 制 有 了 深刻 的 了 解 。 


希望 各 位 读者 看 完 本 章 内 容 也 能 有 同样 的 收获 。 在 本 章 的 前 半 部 
分 ,我 们 会 对 CPU 解释 运行 的 本 地 代码 和 汇编 语言 的 一 对 一 关系 、 汇 
编 语 言 的 源 代码 中 包含 的 用 来 指示 汇编 器 的 伪 命 令 、 栈 的 push/pop 以 
及 调用 函数 的 机 制 进 行 说 明 。 


在 本 章 的 后 半 部 分 ,会 向 大 家 介绍 一 下 局 部 变量 和 全 局 变量 的 不 同 、 
循环 等 流程 控制 的 实现 方式 等 。 在 研究 对 象 方面 ， 我 们 选取 了 Pentium 
等 x86 系列 CPU 用 的 汇编 语言 ， 编 程 工具 则 依然 使 用 前 面 章节 中 用 到 
的 Borland C++。 本 章 的 内 容 相 比 其 他 章节 多 了 不 少 ， 请 大 家 耐心 地 阅 
计 下 去 。 


团 10.1 汇编 语言 和 本 地 代码 是 一 一 对 应 的 

接 下 来 就 让 我 们 进入 到 本 章 的 前 半 部 分 。 在 前 面 革 广 中 已 经 多 次 
提 到 ， 计 算 机 CPU 能 直接 解释 运行 的 只 有 本 地 代码 (机 和 需 语言 ) 程序 。 
用 C 语言 等 编写 的 源 代 码 ， 需 要 通过 各 目的 编译 需 编 译 后 ， 转 换 成 本 
地 代码 。 


通过 调查 本 地 代码 的 内 容 ， 可 以 了 解 程序 最 终 是 以 何 种 形式 来 运 
行 的。 但 是 ， 如 果 耻 接 打开 本 地 代码 来 看 的 话 ， 只 能 看 到 数值 的 罗列 。 
如 果 和 下 接 使 用 这 些 数 值 来 编写 程序 的 话 ， 还 真是 不 太 容 易 理 解 。 因 而 
就 产生 了 这 样 一 种 想法 ， 那 就 是 在 各 本 地 代码 中 ， 附 带 上 表示 其 功能 
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的 英语 单词 缩写 。 例 如 ， 在 加 法 运算 的 本 地 代码 中 加 上 add (addition 
的 缩写 ) 在 比较 运算 的 本 地 代码 中 加 上 cmp ( compare 的 缩写 ) 等 。 这 
些 缩写 称 为 助 记 符 ， 使 用 助 记 符 的 编程 语言 称 为 汇编 语言 。 这 样 ， 通 


过 查看 沪 编 语言 编写 的 源 代码 ， 束 可 以 了 解 程序 的 本 质 了 。 因 为 这 和 
查看 本 地 代码 的 源 代码 ， 是 同一 级 别 的 。 


不 过 ， 即 使 是 用 汇编 语言 编写 的 源 代码 ， 最 终 也 必须 要 转换 成 本 
地 代码 才能 运行 。 负 责 园 换 工 作 的 程序 称 为 汇编 器 ， 转 换 这 一 处 理 本 
号 称 为 汇编 。 在 将 源 代码 转换 成 本 地 代码 这 个 功能 方面 ， 汇 编 带 和 编 
详 倚 是 同 样 的 。 

用 汇编 语言 编写 的 源 代码 ， 和 本 地 代码 是 一 一 对 应 的 。 因 而 ， 本 
地 代码 也 可 以 反 过 来 转换 成 汇编 语言 的 源 代码 。 持 有 该 功能 的 逆 变 换 
程序 称 为 反 汇编 程序 ， 逆 变换 这 一 处 理 本 号 称 为 反 汇编 ( 图 10-1 )。 


汇编 语言 的 源 代码 本 地 代码 


dword ptr [ebp-4],7Bh 3C TB QO0 O00 O00 
dword ptr [ebp-8] ,1C8h > 5 C8 O01 00 00 
eax, dword ptr [ebp-4] 人 @ 
eax, dword ptr [ebp-8] F8 


eax, edx 
eax,l1 
dword ptr [ebp-0Ch| ,eax 


EO a 


哪怕 是 用 C 语言 编写 的 源 代 码 ， 编 译 后 也 会 转换 成 特定 CPU 用 的 
本 地 代码 。 而 将 其 反 汇 编 的 话 ， 束 可 以 得 到 汇编 语言 的 源 代码 ， 并 对 
其 内 容 进 行 调查 。 不 过 ， 本 地 代码 变换 成 C 语言 源 代码 的 反 编译 ， 则 
要 比 反 汇编 困难 。 这 是 因为 ，C 语言 的 源 代码 同 本 地 代码 不 是 一 一 对 应 


©@ 图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


的 ， 因 此 完全 还 原 到 原始 的 源 代 码 是 不 太 可 能 的 “。 


| 10.2 ”通过 编译 器 输出 汇编 语言 的 源 代码 

除了 将 本 地 代码 进行 反 汇 编 这 一 方法 外 ， 通 过 其 他 方式 也 可 以 获 
取 汇 编 语言 的 源 代码 。 大 部 分 C 语言 编译 器 ， 都 可 以 把 利用 C 语言 
写 的 源 代码 转换 成 汇编 语言 的 源 代码 ， 而 不 是 本 地 代码 。 利 用 该 功能 ， 
就 可 以 对 C 语言 的 源 代码 和 汇编 语言 的 源 代 码 进行 比较 研究 。 笔 者 在 
学 生 时 代 的 报告 中 ， 使 用 的 便 是 该 功能 。Borland C++ 中 ， 通 过 在 编译 
髓 的 选项 中 指定 “-$"， 就 可 以 生成 汇编 语言 的 源 代 码 了 。 大 家 也 可 以 
实际 党 试 一 下 。 


用 Windows 的 记事 本 等 文本 编辑 需 编 写 如 代码 清单 10-1 所 示 的 C 
语言 源 代码 ， 并 将 其 命名 为 Sample4.c 进行 保存 。C 语言 源 文件 的 扩展 
名 ， 通 常用 “.c” 来 表示 。 该 程序 是 由 返回 参数 的 两 个 整数 值 之 和 的 
AddNum 函数 ”和 调用 AddNum 函数 的 MyFunc 函数 构成 的 。 因 为 没有 
包含 程序 运行 起 始 位 置 ” 的 main 函数 部 分 ,这 种 情况 下 直接 编译 是 无 法 
运行 的 。 大 家 只 需 把 它 看 成 是 学 习 汇 编 语言 的 一 个 示例 即 可 。 


代码 清单 10-1 ”由 两 个 函数 构成 的 C 语言 的 源 代码 


// 返回 两 个 参数 值 之 和 的 函数 
ae elelN nn ma 


(DD 通过 解析 可 执行 文件 得 到 源 代码 的 方式 称 为 “ 反 汇 编 ” 或 “ 反 编 译 ”， 也 称 
为 “ 反 向 工程 ”。 市 场 上 销售 的 软件 程序 等 ， 有 时 会 在 其 使 用 说 明 书 中 明确 
表明 禁止 反 汇编 及 反 编 译 。 

AddNum 函数 仅仅 返回 两 个 参数 值 的 相 加 结果 。 在 实际 的 编程 中 ， 这 种 函数 
是 不 需要 的 。 为 了 说 明 函 数 调用 的 机 制 ， 这 里 特意 使 用 了 这 种 简单 的 函数 。 

@ 在 命令 提示 符 上 运行 的 程序 中 ，main 函数 位 于 程序 运行 起 始 位 置 。 而 在 
Windows 上 运行 的 程序 中 ，WinMain 函数 位 于 程序 运行 起 始 位 置 。 程 序 运 
行 起 始 位 置 也 称 为 “入 口 点 ”。 
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return a + b; 


} 


// 调用 AddNum 函数 的 函数 
void MyFunc () 


me Gs 
加 ee XeeNNuml(1i23, A456); 


由 Windows 开始 菜单 启动 命令 提示 符 ， 把 当前 目录 ”变更 到 Sample4.c 
保存 的 文件 夹 后 ， 输 入 下 面 的 命令 并 按 下 Enter 键 。bcc32 是 启动 
Borland C++ 编译 器 的 命令 。“-c” 选 项 指 的 是 ， 仅 进行 编译 而 不 进行 链 
接 “。“-S” 选 项 被 用 来 指定 生成 汇编 语言 的 源 代码 。 


bcc32 -cc -S Sample4.c 


作为 编译 的 结果 ， 当 前 日 录 下 会 生成 一 个 名 为 Sample4.asm 的 汇编 
语言 源 代码 。 汇 编 语 言 源 文件 的 扩展 名 ， 通 常用 “.asm” 来 表示 。 下 面 
就 让 我 们 使 用 记事 本 来 看 一 下 Sample4.asm 的 内 容 。 可 以 发 现 ，C 语言 
的 源 代码 和 转换 成 汇编 语言 的 源 代码 是 交叉 显示 的 。 而 这 也 为 我 们 对 
两 者 进行 比较 学 习 提 供 了 绝 好 的 教材 。 在 该 汇编 语言 代码 中 ， 分 号 (; ) 
以 后 是 注释 。 由 于 C 语言 的 源 代 码 变 成 了 注释 ， 因 此 就 可 以 直接 对 
Sample4.asm 进行 汇编 并 将 其 转换 成 本 地 代码 了 (代码 清单 10-2 )。 


Q) 当前 目录 指 的 是 当前 正在 打开 的 目录 (文件 夹 )。 在 命令 提示 符 下 对 C 语言 
的 源 文件 进行 编译 时 ， 该 文件 所 在 的 目录 必须 是 当前 目录 ， 所 以 有 时 候 就 
需要 变换 当前 目录 。 变 换 当 前 目录 时 ， 只 需 在 命令 提示 符 中 的 “CD” 后 面 
室 上 一 个 半角 空格 ， 然 后 加 上 需要 跳 转 的 目录 ， 再 按 下 回 车 即 可 。 例 如 ， 
如 果 要 将 \Test 指定 为 当前 目录 的 话 ， 只 需 输 入 CD\Test 然后 按 下 回 车 键 即 
可 。CD 是 Change Dirctory 的 略称 。 

@) 链接 是 指 把 多 个 目标 文件 结合 成 1 个 可 执行 文件 。 详 情 请 参考 第 8 章 。 
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P 
\ 


or 


( 


GCC G 
Ge 


代码 清单 10-2 ”编译 器 生成 的 汇编 语言 源 代码 ( 一 部 分 做 了 省 略 ， 彩 色 部 分 是 转换 成 注 


释 的 C 语言 源 代码 ) 
gs senenme oes oD 
yalels 
_DATA segment dword public use32 'DATA' 
_DATA ends 
Ese seeamensener oral se es 
esisemenels 
DGROUP group ES AR 
Eenenee ee oDEes, 
_AddNum DEO near 
; elelN ee ea) 
push ebp 
mOV ebp,esp 
J 
return a + b; 
mOV eax,dword ptr [ebp+8j 
add eax,dword ptr [ebp+12] 
| 
pop ebp 
全 起 
_AddNum emlelle 
_MyFunc Eee la 


7 
7 


7 


wen EU 人 
push ebp 


mOV ebp,esp 


LE SS 
eAgeaNmmil > 6: 


push 456 
push 123 
eaunl _AddNum 
add esp,8 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 ©@ 


} 


pop ebp 
到 全 忆 
_MyFunc endp 


Eels 
email 


10.3 不 会 转换 成 本 地 代码 的 伪 指 令 

第 一 次 看 到 汇编 语言 源 代码 的 读者 可 能 会 感到 有 些 难 ， 不 过 实际 
上 很 简单 。 而 且 毫 不 夸张 地 说 它 比 C 语 言 还 要 简单 。 为 了 便于 阅读 汇 
编 语言 编写 的 源 代码 ， 在 开始 源 代码 内 容 的 讲解 前 ， 让 我 们 先 来 看 一 
下 下 面 几 个 要 点 。 


汇编 语言 的 源 代码 ， 是 由 转换 成 本 地 代码 的 指令 ( 后面 讲述 的 操作 
码 ) 和 针对 汇编 器 的 伪 指 令 构 成 的 。 伪 指令 负责 把 程序 的 构造 及 汇编 的 
方法 指示 给 汇编 器 (转换 程序 )。 不 过 伪 指 令 本 身 是 无 法 汇编 转换 成 本 
地 代码 的 。 这 里 我 们 把 代码 清单 10-2 中 用 到 的 伪 指 令 部 分 摘出 ， 如 代 
码 清单 10-3 所 示 。 


代码 清单 10-3 ”从 代码 清单 10-2 中 摘出 的 伪 指 令 部 分 ( 彩色 部 分 是 伪 指 令 ) 


ES omenmee ose epDE 


Eves 

_DATA segment dword public use32 'DATA,' 
_DATA ends 

ES seemenee ere ul euse ds 
BSSengs 

DGROUP group _BSS, DATA 


Deemer ue OPE 


_AddNum DDE nea 
_AddNum engee 
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_MyFunc mee Mean 


_MyFunc emele 


le 
cel 


由 伪 指 令 segment 和 ends 围 起 来 的 部 分 ， 是 给 构成 程序 的 命令 和 
数据 的 集合 体 加 上 一 个 名 字 而 得 到 的 ， 称 为 段 定义 。 段 定义 的 英文 表 
达 segment 具有 “区 域 ” 的 意思 。 在 程序 中 ， 段 定义 指 的 是 命令 和 数据 
等 程序 的 集合 体 的 意思 。 一 个 程序 由 多 个 段 定义 构成 。 


源 代 码 的 开始 位 置 ， 定义 了 3 个 名 称 分 别 为 TEXT、 DATA、_BSS 
的 段 定义 。_TEXT 是 指令 的 段 定 义 ，_DATA 是 被 初始 化 (有 初始 值 ) 
的 数据 的 段 定义 ，_BSS 是 尚未 初始 化 的 数据 的 段 定义 。 类 似 于 这 种 段 
定义 的 名 称 及 划分 方法 是 Borland C++ 的 规定 ， 是 由 Borland C++ 的 编 
译 妖 自动 分 配 的 。 因 而 程序 段 定义 的 配置 顺序 就 成 了 _TEXT、_DATA、 
_BSS， 这 样 也 确保 了 内 存 的 连续 性 。group 这 一 伪 指 令 ， 表 示 的 是 把 
_BSS 和 _DAIA 这 两 个 段 定 义 汇总 为 名 为 DGROUP 的 组 。 此 外 ， 栈 和 
堆 的 内 存 空间 会 在 程序 运行 时 生成 ， 这 一 点 已 经 在 第 8 章 中 做 过 介绍 。 


于 起 AddNum 和 MyFun 的 TEXT segment 和 TEXT ends， 表 
示 _AddNum 和 MyFunc 是 属于 _TEXT 这 一 段 定义 的 。 因 此 ， 即 使 在 
源 代码 中 指令 和 数据 是 混杂 编号 的 ， 经 过 编译 或 者 汇编 后 ， 也 会 转换 
成 段 定义 划分 整齐 的 本 地 代码 。 


_AddNum proc 和 AddNum endp 围 起 来 的 部 分 ， 以 及 _MyFunc 


Q) 段 定 义 (segment) 是 用 来 区 分 或 者 划 定 范围 区 域 的 意思 。 汇 编 语言 的 
Segment 伪 指 令 表 示 段 定义 的 起 始 ，ends 伪 指 令 表 示 段 定义 的 结束 。 段 定 
义 是 一 个 连续 的 内 存 空 间 。 

@) group 指 的 是 将 源 代 码 中 不 同 的 段 定义 在 本 地 代码 程序 中 整合 为 一 个 。 
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proc 和 MyFunc endp 围 起 来 的 部 分 ， 分别 表示 AddNum 晒 数 和 
MyFunc 也 数 的 范围 。 编 详 后 在 也 数 名 前 附 市 上 下 划 线 (_)， 是 
Borland C++ 的 规定 。 在 C 语言 中 编写 的 AddNum 困 数 ， 在 内 部 是 以 
_AddNum 这 个 名 称 锌 处 理 的 。 伪 指令 proc 和 endp 于 起 来 的 部 分 ， 表 
示 的 是 过 程 ( procedure ) 的 范围 。 在 汇编 语言 中 ， 这 种 相当 于 C 语言 的 


明 数 的 形式 称 为 过 程 。 

末尾 的 end 伪 指 令 ， 表 示 的 是 源 代 码 的 结束 。 而 至 于 其 他 伪 指 令 
的 具体 意思 ， 大 家 不 了 解 也 没有 关系 。 因 为 该 章 的 主要 目的 并 不 是 用 
汇编 语言 来 编写 程序 。 大 家 只 需要 能 恋 居 汇编 语言 的 源 代 码 就 足够 了 。 


圈 10.4 汇编 语言 的 语法 是 “操作 码 + 操作 数 ” 
在 汇编 语言 中 ，1 行 表示 对 CPU 的 一 个 指令 。 汇 编 语言 指令 的 语 
法 结构 是 操作 码 + 操作 数 (也 存在 只 有 操作 码 没 有 操作 数 的 指令 )。 


操作 码 表示 的 是 指令 动作 ， 操 作 数 表示 的 是 指令 对 象 。 操 作 人 码 和 
操作 数 罗 列 在 一 起 的 语法 ， 就 是 一 个 天 文 的 指令 文本 。 操 作 人 码 是 动词 ， 
操作 数 相 当 于 宾语 。 例 如 ， 用 汇编 语言 来 分 析 “Give me money” 这 个 
英文 指令 的 话 ，Give 就 是 操作 人 码 ，me 和 money 就 是 操作 数 。 汇 编 语言 
中 存在 多 个 操作 数 的 情况 下 ， 要 用 逗号 把 它们 分 割 开 来 ， 就 像 Give me， 
money 这 样 。 

能 够 使 用 何 种 形式 的 操作 码 ， 是 由 CPU 的 种 类 决定 的 。 表 10-1 对 
代码 清单 10-2 中 用 到 的 操作 码 的 功能 进行 了 整理 ， 大 家 可 以 看 一 下 。 
这 些 都 是 32 位 x86 系列 CPU 用 的 操作 码 。 操 作 数 中 指定 了 寄存 句 名 、 


在 汇编 语言 中 ， 类 似 于 mov 这 样 的 指令 称 为 “操作 码 ”( opcode )， 作 为 指 


令 对 象 的 内 存 地 址 及 寄存 器 称 为 “操作 数 ”( operand )。 被 转换 成 CPU 可 
尺 直 接 解析 运行 的 二 进 制 的 操作 码 和 操作 数 ， 就 是 本 地 代码 。 
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内 存 地 址 、 篆 数 等 。 在 表 10-1 中 ， 操 作 数 是 用 A 和 B 来 表示 的 。 


表 10-1 代码 清单 10-2 中 用 到 的 操作 码 的 功能 


操作 码 操作 数 功 能 

mov A 把 B 的 值 赋 给 A 

and A EB 把 A 同 B 的 值 相 加 ， 并 将 结果 赋 给 人 
push A 把 A 的 值 存储 在 栈 中 

pop A 从 栈 中 读 取 出 值 ， 并 将 其 赋 给 A 

call 和 调用 函数 A 

ret 下 将 处 理 返 回 到 浮 数 的 调用 源 


本 地 代码 加 载 到 内 存 后 才能 运行 。 内 存 中 存储 春 构成 本 地 代码 的 
和 令 和 数据 。 程 序 运 行 时 ，CPU 会 从 内 存 中 把 指令 和 数据 读 出 ， 然 后 
再 将 其 存储 在 CPU 内 部 的 寄存 泛 中 进行 处 理 (图 10-2 )。 


解析 、 运 行 | 


图 10-2 CPU 和 内 存 的 关系 
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寄存 需 是 CPU 中 的 存储 区 域 。 不 过 ， 寄 存 器 并 不 仅仅 具有 存储 指 
令 和 数据 的 功能 ， 也 有 运算 功能 。x86 系列 CPU 的 寄存 器 的 主要 种 类 
和 角色 如 表 10-2 所 示 。 寄 存 融 的 名 称 会 通过 汇编 语言 的 源 代码 指定 给 
操作 数 。 内 存 中 的 存储 区 域 是 用 地 址 编号 来 区 分 的 。CPU 内 的 寄存 器 
是 用 eax 及 ebx 这 些 名 称 来 区 分 的 。 此 外 ，CPU 内 部 也 有 程序 员 无 法 
直接 操作 的 寄存 器 。 例 如 ， 表 示 运 算 结 果 正 负 及 溢出 状态 的 标志 寄存 
髓 及 操作 系统 专用 的 寄存 器 等 ， 都 无 法 通过 程序 员 编 写 的 程序 直接 进 
行 操作 。 


表 10-2 x86 系列 CPU 的 主要 寄存 器 ” 


寄存 器 名 名 称 主要 功能 
eax 累加 寄存 器 运算 
ebx 基 址 寄存 器 存储 内 存 地 址 
ecx 计数 寄存 器 计算 循环 次 数 
edx 数据 计数 器 存储 数据 
esi 源 基 址 寄存 器 存储 数据 发 送 源 的 内 存 地 址 
edi 目标 基 址 寄存 器 存储 数据 发 送 目 标的 内 存 地 址 
ebp 扩展 基 址 指针 寄存 器 存储 数据 存储 领域 基点 的 内 存 地 址 
esp 扩展 栈 指针 寄存 器 存储 栈 中 最 高 位 数据 的 内 存 地 址 


(DD 表 10-2 中 表示 的 寄存 器 名 称 是 x86 自 带 的 寄存 器 名 称 。 在 第 1 章 中 表 1-1 
列 出 的 寄存 器 名 称 是 一 般 叫 法 。 两 者 有 些 不 同 ,， 例如 ，xXx86 的 扩展 基 址 指 
针 寄 存 器 就 相当 于 第 1 章 中 介绍 的 基 址 寄存 器 。 

( x86 系列 32 位 CPU 的 寄存 器 名 称 中 ， 开 头 都 带 了 一 个 字母 e， 例 如 eax、 
ebx、ecx、edx 等 。 这 是 因为 16 位 CPU 的 寄存 器 名 称 是 ax、bx、cx、dx 
等 。32 位 CPU 寄存 器 的 名 称 中 的 e， 有 扩展 (extended ) 的 意思 。 我 们 也 
可 以 仅 利用 32 位 寄存 器 的 低 16 位 ， 此 时 只 需 把 要 指定 的 寄存 器 名 开头 的 
字母 ee 去掉 即 可 。 
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国 10.5 最 常用 的 mov 指令 


指令 中 最 党 使 用 的 是 对 寄存 器 和 内 存 进 行 数据 存储 的 mov 指令 。 
mov 指令 的 两 个 操作 数 ， 分 别 用 来 指定 数据 的 存储 地 和 读 出 源 。 操 作 
数 中 可 以 指定 寄存 如 、 和 常数、 标签 (附加 在 地 址 前 )， 以 及 用 方 括号 
([]) 围 起 来 的 这 些 内 容 。 如 来 指定 了 没有 用 方 括 号 围 起 来 的 内 容 ， 
就 表示 对 该 值 进 行 处 理 ;， 如 采 指 定 了 用 方 括 号 围 起 来 的 内 容 ， 方 括号 
中 的 值 则 会 被 解释 为 内 存 地 址 ， 然 后 就 会 对 该 内 存 地 址 对 应 的 值 进 行 
读 写 操作 。 接 下 来 就 让 我 们 来 看 一 下 代码 清单 10-2 中 用 到 的 mov 指 

mov ebp,esp 


mov eax,dword ptr [ebp+8] 


mov ebp,esp 中 ，esp 寄存 右 中 的 值 被 直接 存储 在 了 ebp 寄存 融 中 。 
esp 寄存 带 的 值 是 100 时 ebp 寄存 大 的 值 也 是 100。 而 在 mov eax,dword 
ptr [ebp+8] 的 情况 下 ,ebp 寄存 带 的 值 加 8 后 得 到 的 值 会 被 解释 为 内 存 
地 址 。 如 果 ebp 寄存 需 的 值 是 100 的 话 ， 那 么 eax 寄存 絮 中 存储 的 就 是 
100+8 = 108 地 址 的 数据 。dword ptr( double word pointer ) 表示 的 是 从 
指定 内 存 地 址 读 出 4 字 方 的 数据 。 像 这 样 ， 有 时 也 会 在 汇编 语言 的 操 
作 数 前 附带 dword ptr 这 样 的 修饰 语 。 


10.6 ”对 栈 进行 push 和 pop 

程序 运行 时 ， 会 在 内 存 上 申请 分 配 一 个 称 为 栈 的 数据 空间 。 栈 
(stack ) 有 “干草 堆积 如 山 ” 的 意思 。 就 如 该 名 称 所 表示 的 那样 ， 数 据 
在 存储 时 是 从 内 存 的 下 层 (大 的 地 址 编号 ) 逐渐 往 上 层 (小 的 地 址 编 
号 ) 累积 ， 读 出 时 则 是 按照 从 上 往 下 的 顺利 进行 (图 10-3 ) 的 。 
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push 指 令 存 储 pop 指 令 读 出 
数据 的 顺序 数据 的 顺序 


低位 地 址 
会 


未 使 用 的 空间 


push pop 


esp 寄 存 器 指示 内 存 空 间 
的 内 存 地 址 类 


高 位 地 址 


图 10-3 栈 的 模型 


栈 是 存储 临时 数据 的 区 域 ， 它 的 特点 是 通过 push 指令 和 pop 指令 
进行 数据 的 存储 和 读 出 。 往 栈 中 存储 数据 称 为 “入 栈 ”"， 从 栈 中 读 出 数 
据 称 为 “出 栈 ”。32 位 x86 系列 的 CPU 中 ， 进 行 1 次 push 或 pop， 即 
可 处 理 32 位 (4 字 节 ) 的 数据 。 


push 指令 和 pop 指令 中 只 有 一 个 操作 数 。 该 操作 数 表示 的 是 “push 
的 是 什么 及 pop 的 是 什么 ”， 而 不 需要 指定 “对 哪 一 个 地 址 编号 的 内 存 
进行 push 或 pop”。 这 是 因为 ， 对 栈 进 行 读 写 的 内 存 地 址 是 由 esp 寄存 
从 ( 栈 指针 ) 进行 管理 的 。push 指令 和 pop 指令 运行 后 , esp 寄存 带 的 
值 会 日 动 进 行 更 新 ( push 指令 是 -4，pop 命令 是 +4 )， 因 而 程序 员 就 没 
有 必要 指定 内 存 地 址 了 。 

代码 清单 10-2 中 多 次 用 到 了 push 指令 和 pop 指令 。push 指令 运行 
后 ， 操 作 数 中 指定 的 值 就 会 被 目 动 push 入 栈 ，pop 指令 运行 后 ， 最 后 
存储 在 栈 中 的 值 承 会 被 pop 到 指定 的 操作 数 中 出 栈 。 就 如 第 4 章 中 所 
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介绍 的 那样 ， 这 种 数据 的 存储 顺序 称 为 LIFO (Last In First Out ) 
J 


10.7 函数 调用 机 制 
前 面 说 了 这 么 多 ， 至 此 我 们 终于 把 阅读 汇编 语言 源 代码 的 准备 工 
作 完 成 了 。 让 我 们 再 来 回顾 一 下 代码 清单 10-2 的 内 容 。 首 先 ， 让 我 们 从 
MyFunc 困 数 调用 AddNum 函数 的 汇编 语言 部 分 开始 ， 来 对 孔 数 的 调用 
机 制 进行 说 明 。 函 数 调用 是 栈 发 挥 大 作用 的 场合 。 把 代码 清单 10-2 中 的 
C 语言 源 代码 部 分 去 除 ， 然 后 再 在 各 行 妃 加 注释 ， 这 时 汇编 语言 的 源 代 
人 码 束 如 代码 清单 10-4 所 示 。 这 也 就 是 MyFunc 因数 的 处 理 内 容 。 


代码 清单 10-4 ”函数 调用 的 汇编 语言 代码 “ 


_MyFunc EOS Mea 


push ebp ; 将 ebp 寄存 器 的 值 存 入 栈 中 (1 
mov ebp,esp ; 将 ebp 寄存 器 的 值 存 入 ebp 寄存 器 ke 
push 456 ; 456 入 栈 G0 
push 2 ; 123 入 栈 - ley 
call _AdqdNum ; 调用 AdqNum 函数 (5 
adqd ebp,8 ; esp 寄存 器 的 值 加 8 (6) 
pop ebp ; 读 出 栈 中 的 数值 存 入 esp 寄存 器 (7 
el ; 结束 MyFunc 函数 ， 返 回 到 调用 源 (sy 
_MyFunc endp 


(1)、(2)、(7)、(8) 的 处 理 适 用 于 C 语言 中 所 有 的 果 数 ， 我 们 会 
在 后 面 展 示 AddNum 珊 数 处 理 内 容 时 进行 说 明 。 这 里 希望 大 家 先 关 注 
一 下 (3 ) 一 (6) 部 分 ， 这 对 了 解 函 数 调 用 的 机 制 至 关 重 要 。 

(3 ) 和 (4) 表示 的 是 将 传递 给 AddNum 孙 数 的 参数 通过 push 人 
栈 。 在 C 语言 的 源 代 码 中 ， 虽 然 记 述 为 函数 AddNum ( 123，456 )， 但 


四 在 函数 的 入 口 处 把 寄存 器 ebp 的 值 入 栈 保存 (代码 清单 10-4 (1 ))， 在 函数 
的 出 口 处 出 栈 ( 代 码 清 单 10-4 (7 ))， 这 是 C 语言 编译 器 的 规定 。 这 样 做 是 
为 了 确保 函数 调用 前 后 ebp 寄存 器 的 值 不 发 生变 化 。 
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入 栈 时 则 会 按照 456、123 这 样 的 顺序 ， 也 就 是 位 于 后 面 的 数值 先 人 
栈 。 这 是 C 语 言 的 规定 。(5 ) 的 call 指令 ， 把 程序 流程 跳 转 到 了 操作 
数 中 指定 的 AddNum 函数 所 在 的 内 存 地 址 处 。 在 汇编 语言 中 ， 函 数 各 
表示 的 是 函数 所 在 的 内 存 地 址 。AddNum 冰 数 处 理 完毕 后 ， 程 序 流程 
必须 要 返回 到 编号 (6 ) 这 一 行 。call 指令 运行 后 ，call 指令 的 下 一 行 
((6) 这 一 行 ) 的 内 存 地址 (调用 函数 完毕 后 要 返回 的 内 存 地 址 ) 会 目 动 
地 push 入 栈 。 该 值 会 在 AddNum 困 数 处 理 的 最 后 通过 ret 指令 pop 出 
栈 ， 然 后 程序 流程 就 会 返回 到 (6 ) 这 一 行 。 


(6 ) 部 分 会 把 栈 中 存储 的 两 个 参数 (456 和 123 ) 进行 销毁 处 理 ， 也 
就 是 在 第 5 章 提 到 的 栈 清理 处 理 。 虽 然 通 过 使 用 两 次 pop 指令 也 可 以 实 
现 ， 不 过 采用 esp 寄存 器 加 8 的 方式 会 更 有 效率 (处 理 1 次 即 可 ) 对 栈 进 
行 数值 的 输入 输出 时 ， 数 值 的 单位 是 4 字 节 。 因 此 ， 通 过 在 负责 栈 地 址 管 
理 的 esp 寄存 融 中 加 上 4 的 2 倍 8， 就 可 以 达到 和 运行 两 次 pop 命令 同样 
的 效果 。 虽 然 内 存 中 的 数据 实际 上 还 残留 着 ， 但 只 要 把 esp 寄存 央 的 值 
更 新 为 数据 存储 地 址 前 面 的 数据 位 置 ， 该 数据 也 就 相当 于 被 销毁 了 。 


前 面 已 经 提 到 ，push 指令 和 pop 指令 必须 以 4 字 节 为 单位 对 数据 
进行 人 栈 和 出 栈 处 理 。 因 此 ，AddNum 函数 调用 前 和 调用 后 栈 的 状态 
变化 就 如 图 10-4 所 示 。 长 度 小 与 4 字 市 的 123 和 456 这 些 值 在 存储 时 ， 
也 占用 了 4 学 市 的 栈 区 域 。 


代码 清单 10-1 中 列 出 的 C 语言 源 代码 中 ， 有 一 个 处 理 是 在 变量 c 
中 存储 AddNum 函数 的 返回 值 ， 不 过 在 汇编 语言 的 源 代 码 中 ， 并 没有 
与 此 对 应 的 处 理 。 这 征 因为 编 详 肯 有 最 优化 功能 。 最 优化 功能 是 编 详 
从 在 本 地 代码 上 费 尽 功 夫 实现 的 ， 其 目的 是 让 编 详 后 的 程序 运行 速度 
更 快 、 文 件 更 小 。 在 代码 清单 10-1 中 ， 由 于 存储 着 AddNum 消 数 返回 
值 的 变量 c 在 后 面 没 有 被 用 到 ， 因 此 编 详 硕 就 会 认为 “该 处 理 没 有 意 
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进而 也 就 没有 生成 与 之 对 应 的 汇编 语言 代码 。 在 编译 代码 清单 
10-1 的 代码 时 ， 应 该 会 出 现 “警告 W8004 Sample4.c 11: 'c' 的 赋值 未 被 
使 用 ( 隆 数 MyFunc )》 这 样 的 警告 消息 。 


(a ) AddNum 函 数 调用 前 (e ) 从 AddNum 返 回 后 (f) MyFunc 函 数 处 理 完 毕 时 


未 使 用 的 空间 
未 使 用 的 空间 


未 使 用 的 空间 
( 清理 处 理 ) 


返回 目的 地 的 内 存 地 址 | 国 吵 


a5@ 456 
ebp 寄存 器 的 值 ebp 寄存 器 的 值 


图 10-4 ”AddNum 函数 调用 前 后 栈 的 状态 变化 


人 10.8 函数 内 部 的 处 理 
接 下 来 ， 让 我 们 透 过 执行 AddNum 函数 的 源 代码 部 分 ， 来 看 一 下 
参数 的 接收 、 返 回 值 的 返回 等 机 制 (代码 清单 10-5 )。 


代码 清单 10-5 ”函数 内 部 的 处 理 


_AddNum see near 
Bu 人 人 人 人 人 人 人 < 
mov ebp ,esp 一 (2 
mov eax, dword ptr [ebp+8] “一 所 
adq eax,dword ptr [ebp+12] 一 人 4 
pop ebp “一 (5 
ret “一 (6 

_AddNum emlelle 
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ebp 寄存 上 的 值 在 (1) 中 入 栈 ， 在 (5 ) 中 出 栈 。 这 主要 是 为 了 把 
数 中 用 到 的 ebp 寄存 此 的 内 容 ， 恢 复 到 函数 调用 前 的 状态 。 在 进入 
数 处 理 之 前 ， 无 法 确定 ebp 寄存 带 用 到 了 什么 地 方 ,但 由 于 函数 内 


嘱 
嘱 


部 也 会 用 到 ebp 寄存 带 ， 所 以 就 暂时 将 该 值 保存 了 起 来 。CPU 拥有 的 
寄存 大 是 有 数量 限制 的 。 在 水 数 调 用 前 ， 调 用 源 有 可 能 已 经 在 使 用 ebp 
寄存 带 了 。 因 而 ， 在 函数 内 部 利用 的 寄存 溃 ， 要 尽量 返回 到 函数 调用 
前 的 状态 。 为 此 ， 我 们 就 需要 将 其 暂时 保存 在 栈 中 ， 然 后 再 在 函数 处 
理 完毕 之 前 出 栈 ,， 使 其 返回 到 原来 的 状态 。 


(2 ) 中 把 负责 管理 栈 地 址 的 esp 寄存 絮 的 值 赋值 到 了 ebp 寄存 大 
中 。 这 是 因为 ， 在 mov 指令 中 方 括号 内 的 参数 ， 是 不 允许 指定 esp 寄 
存 融 的 。 因 此 ， 这 里 就 采用 了 不 直接 通过 esp， 而 是 用 ebp 寄存 带 来 读 
写 栈 内 容 的 方法 。 


(3 ) 是 用 [ebp+8] 指定 栈 中 存储 的 第 1 个 参数 123， 并 将 其 读 出 到 
eax 寄存 从 中 。 像 这 样 ， 不 使 用 pop 指令， 也 可 以 参照 栈 的 内 容 。 而 之 
所 以 从 多 个 寄存 器 中 选择 了 eax 寄存 器 ， 是 因为 eax 寄存 器 是 负责 运算 
的 累加 寄存 需 。 


通过 (4 ) 的 add 指令 ， 把 当前 eax 寄存 器 的 值 同 第 2 个 参数 相 加 
后 的 结果 存储 在 eax 寄存 天 中 。[ebp+12] 是 用 来 指定 第 2 个 参数 456 
的 。 在 C 语言 中 ， 冰 数 的 返回 值 必须 通过 eax 寄存 需 返 回 ， 这 也 是 规 
定 。 不 过 ， 和 ebp 寄存 融 不 同 的 是 ，eax 寄存 需 的 值 不 用 还 原 到 原始 状 
态 。 至 此 ， 我 们 进行 了 很 多 细节 的 说 明 ， 其 实 就 是 和 希望 大 家 了 解 “ 范 数 
的 参数 是 通过 栈 来 传递 ， 返 回 值 是 通过 寄存 器 来 返回 的 ”这 一 点 。 

(6 ) 中 ret 指令 运行 后 ， 函 数 返 回 目的 地 的 内 存 地 址 会 目 动 出 栈 ， 
据 此 ， 程 序 流程 就 会 跳 转 返回 到 代码 清单 10-4 的 (6) (Call AddNum 
的 下 一 行 ) 这 时 ，AddNum 郴 数 入 口 和 出 口 处 栈 的 状态 变化 ， 就 如 图 
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10-5 所 示 。 将 图 10-4 和 图 10-5 按照 (a)(b)(c)(d)(e)(f) 的 顺 
序 来 看 的 话 ， 陶 数 调用 处 理 时 栈 的 状态 变化 就 会 很 清楚 了 。 由 于 (a) 
状态 时 处 理 跳 转 到 AddNum 阴 数 ， 因 此 (a) 和 (b) 是 同样 的 。 同 理 ， 
在 (d) 状态 时 ， 处 理 跳 转 到 了 调用 源 ， 因 此 (d) 和 (e) 是 同样 的 。 在 
(f) 状态 时 则 进行 了 清理 处 理 。 栈 的 最 高 位 的 数据 地 址 ， 是 一 下 存储 在 
esp 寄存 硕 中 的 。 


(c ) 运算 处 理 时 


| 未 使 用 的 空间 
未 使 用 的 空间 
未 使 用 的 空间 
ebp 
返回 目的 地 的 内 存 地 址 | 世 只 ”返回 日 的 地 的 内 存 地 址 | 国 吵 
人 人。 由 2 123 
456 456 456 


ebp 寄存 器 的 值 ebp 寄存 器 的 值 ebp 寄存 器 的 值 


图 10-5 AddNum 函数 内 部 的 栈 状态 变 


10.9 ”始终 确保 全 局 变量 用 的 内 存 空 间 

就 悉 了 汇编 语言 后 ， 接 下 来 将 进入 到 本 章 的 后 半 部 分 。C 语言 中 ， 
印 数 外 部 定义 的 变量 称 为 全 局 变量 ， 在 函数 内 部 定义 的 变量 称 为 局 
部 变量 。 全 局 变量 可 以 参阅 源 代码 的 任意 部 分 ， 而 局 部 变量 只 能 在 定 
义 该 变量 的 函数 内 进行 参阅 。 例 如 ， 在 MyFuncA 函数 内 部 定义 的 i 这 
个 局 部 变量 就 无 法 通过 MyFuncB 函数 进行 参阅 。 与 此 相反 ， 如 果 是 在 
汕 数 外 部 定义 的 全 局 变量 ，MyFuncA 困 数 和 MyFuncB 困 数 都 可 以 参 


EE 
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阅 。 下 面 ， 就 让 我 们 通过 汇编 语言 的 源 代 码 ， 来 看 一 下 全 局 变量 和 局 
部 变量 的 不 同 。 


代码 清单 10-6 的 C 语言 源 代码 中 定义 了 初始 化 〈 设 定 了 初始 值 ) 
的 al~a5 这 5 个 全 局 变量 ， 以 及 没有 初始 化 (没有 设 定 初始 值 ) 的 
p1 一 05 这 5 个 全 局 变量 ， 此 外 还 定义 了 cl 一 cl0 这 10 个 局 部 变量 ， 且 
分 别 给 各 变量 赋 了 值 。 程 序 的 内 容 没 有 什么 特别 的 意思 ， 这 里 主要 是 
为 了 回 大 家 演示 。 


代码 清单 10-6 ”使 用 全 局 变量 和 局 部 变量 的 C 语言 源 代码 
// 定义 被 初始 化 的 全 局 变量 


im Gl 三 省 7 
ie G2 = 2 
Im a = 3,， 
1 总 和 三 条 
TS 
// 定义 没有 初始 化 的 全 局 变量 
dim ld lI02, 58 1557 


// 定义 函数 
vole Mowae!() 
| 
// 定义 局 部 变量 


mt G1, 2, 3, C4, C5, 6, 7, GO, 9, 10 


// 给 局 部 变量 赋值 


Gl 三 


7 


G2 = 


Ne 


GE 有 一 


N。 


C4 = 


~。 


G@ 与 本 三 
GIGE 三 


N。 


@7 研 


N。 


三 


~. 


\D oo、~QOQOOU 人 WwW DN Pp 


卢 ~。 
(3 


GSE 
El0 三 


// 把 局 部 变量 的 值 赋 给 全 局 变量 


二 Cn 
a2 = C2. 
eo. 
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a4 = C4:; 
as 三 和 5S 
9 三 @E; 
Id2 三 @7;s 
I93 二 @Y; 
lo eo 
los 三 人 1L0/ 


将 代码 清单 10-6 变换 成 汇编 语言 的 源 代 码 后 ， 结 果 就 如 代码 清单 
10-7 所 示 。 这 里 为 了 方便 说 明 ， 我 们 省 略 了 一 部 分 汇编 语言 源 代 码 ， 
并 改变 了 一 下 段 定义 的 配置 顺序 ， 删 除了 注释 。 关 于 代码 清单 10-7 中 
出 现 的 汇编 语言 的 指令 ， 请 参考 表 10-3。 


代码 清单 10-7 ”代码 清单 10-6 转换 成 汇编 语言 后 的 结果 


_DATA 
_ 1 


_a2 
_ 3 
_a4 
_@&5 
DATA 


_BSS 
| 


_b2 
中 
_b4 
_b5 


_BSS 


segment 
label 
dd 
label 
dd 
label 
dd 
label 
lel 
label 
el@l 
ends 


segment 
label 
db 
label 
db 
label 
Gl5 
label 
db 
label 
db 
ends 


dword public use32 'DATA' 

dword 一 (4) 
1 一 (5) 
dword 

急 

dword ( 
3 

dword 

4 

dword 


S 


clonsem oe se es 

dword 

0 2 
dword 

ace (2D 

dword (2 
4 qup (?) 

dword 

wo) 

dword 

4 qup (?) 
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_TEXT segment dword public use32 'CODE' 
_MyFunc EO near 
push ebp 
mov eB es (ll 
adqd esp,-20 全 
push ebx 
push esi 
moOV eax,l1 
mOV edx,2 | 
moV ecCx,3 (8) 
mOV ebx,4 | 
mOV esi,5 
mov dword ptr [ebp-4],6 
mov eworemele eI | 
mov dword per le (9) 
mov dword ptr [ebp-16] ,9 | 
mov dword ptr [ebp-20] ,10 
mOV Green ,Sax 
mOV chkvene na 
mov dword ptr [ a3] ,ecx (7 (3, 
mOV dword ptr [ a4l],ebx 
mOV ekene ns 
mov eax, dword ptr [ebp-4] 
mOV Cae DE | Sl) ,eax 
mov edx,dword ptr [ebp-8] 
mOV clene ne 
mOV ecx,dword ptr [ebp-12] 
moOV chivensel enamel le 
mov eax, dword ptr [ebp-16] 
mOV dword ptr [ b4],eax 
mov edx, dword ptr [ebp-20] 
mOV clvensee ns 
pop esi 
pop ebx 
mov esp, ebp E12 
pop ebp 
se 
_MyFunc endp 
Enels 


表 10-3 ”代码 清单 10-7、10-9、10-12、10-14 中 用 到 的 汇编 语言 指令 的 功能 


操作 码 
add 


call 


操作 数 
A,B 
A 


功 


AL 
用 


把 人 A 的 值 和 B 的 值 相 加 ， 并 把 结果 存 入 人 
调用 函数 A 
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操作 码 操作 数 功 能 
cmp A,B 对 人 和 B 的 值 进 行 比 较 ， 比 较 结 果 会 自动 存 入 标志 寄存 器 中 
inc 全 人 A 的 值 加 1 


jge 标签 名 和 cmp 命令 组 合 使 用 。 跳 转 到 标签 行 

jl 标签 名 ”和 cmp 命令 组 合 使 用 。 跳 转 到 标签 行 

jle 标签 名 “和 cmp 命令 组 合 使 用 。 跳 转 到 标签 行 

jmp 标签 名 ”将 控制 无 条 件 跳 转 到 指定 标签 行 

mov A,B 把 B 的 值 赋值 给 A 

pop 从 从 栈 中 读 取出 数值 并 存 入 人 中 

push A 把 A 的 值 存 入 栈 中 

ret 下 将 处 理 返 回 到 调用 源 

xor A,B A 和 B 的 位 进行 异 或 比较 ， 并 将 结果 存 入 人 中 


正如 本 章 前 半 部 分 所 讲 的 那样 ， 编 译 后 的 程序 ， 会 被 归 类 到 名 为 
段 定 义 的 组 。 初 始 化 的 全 局 变量 ， 会 像 代 码 清单 10-7 的 (1 ) 那样 被 汇 
总 到 名 为 _DATA 的 段 定义 中 ， 没 有 初始 化 的 全 局 变量 ， 会 像 (2 ) 那样 
被 汇总 到 名 为 _BSS 的 段 定 义 中 。 指 令 则 会 像 (3 ) 那样 被 汇总 到 名 为 _ 
TEXT 的 段 定 义 中 。 这 些 段 定义 的 名 称 是 由 Borland C++ 的 使 用 规范 来 
决定 的 。 DATA segment 和 DATA ends、 BSS segment 和 BSS ends、 
_TEXT segment 和 _TEXT ends， 这 些 都 是 表示 各 段 定义 范围 的 伪 指 令 。 


首先 让 我 们 来 看 一 下 _DATA 段 定 义 的 内 容 。(4) 中 的 _al label 
dword 定义 了 _al 这 个 标签 。 标 签 表 示 的 是 相对 于 段 定 义 起 始 位 置 的 位 
置 。 由 于 al 在 _DAIA 段 定 义 的 开头 位 置 ， 所 以 相对 位 置 是 0。_al 
就 相当 于 全 局 变量 c1。 编 详 后 的 冰 数 名 和 变量 名 前 会 附加 一 个 下 划 线 
(_)， 这 也 是 Borland C++ 的 规定 。( 5 ) 中 的 dd 1 指 的 是 ， 申 请 分 配 了 
4 字 节 的 内 存 空间 ， 存 储 厦 1 这 个 初始 值 。dd ( define double word ) 表 
示 的 是 有 两 个 长 度 为 2 的 字 节 领域 ( word )， 也 就 是 4 字 节 的 意思 。 
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Borland C++ 中 ， 由 于 int 类 型 的 长 度 是 4 字 市 ， 因 此 汇编 带 就 把 int al 
= 1; 变换 成 了 _al label dword 和 dd 1。 同 样 ， 这 里 也 定义 了 相当 于 全 局 
变量 2 一 as 的 标签 _a2 一 a5， 它 们 各 上 自 的 初始 值 2 一 5 也 都 被 存储 在 
了 4 字 节 的 领域 中 。 


接 下 来 ， 让 我 们 来 看 一 下 _BSS 段 定义 的 内 容 。 这 里 定义 了 相当 于 
全 局 变量 b1~55 的 标签 bl 一 b5。(6 ) 的 db 4 dup(?) 表示 的 是 申请 分 
配 了 4 他 市 的 领域 , 但 值 沿 未 确定 (这 里 用 ?来 表示 ) 的 意思 。db 
( define byte ) 表示 有 1 个 长 度 是 1 字 市 的 内 存 空间 。 因 而 ，db 4 dup(?) 
的 情况 下 ， 就 是 4 字 市 的 内 存 空 间 。 这 里 大 家 要 注意 不 要 和 dd 4 混淆 
了 。db 4 dup(?) 表示 的 是 4 个 长 度 是 1 字 节 的 内 存 空间 。 而 db 4 表示 
的 则 是 双 字 节 (=4 字 节 ) 的 内 存 空间 中 存储 的 值 是 4。 


在 _DATA 和 _BSS 的 段 定义 中 ， 全 局 变量 的 内 存 空间 都 得 到 了 确 
保 ， 这 一 点 大 家 想必 都 清楚 了 吧 。 因 而 ， 从 程序 的 开始 到 结束 ， 所 有 
部 分 都 可 以 参阅 全 局 变量 。 而 这 里 之 所 以 根据 是 否 进行 了 初始 化 把 全 
局 变量 的 段 定义 划分 为 了 两 部 分 ， 是 因为 在 Borland C++ 中 ， 程 序 运 行 
时 没有 初始 化 的 全 局 变量 的 领域 ( _BSS 段 定义 ) 都 会 被 设 定 为 0 进行 
初始 化 。 可 见 ， 通 过 汇总 ， 初 始 化 很 容易 实现 ， 只 要 把 内 存 的 特定 范 
于 全 部 设 定 为 0 就 可 以 了 。 


国 10.10 临时 确保 局 部 变量 用 的 内 存 空间 

为 什么 局 部 变量 只 能 在 定义 该 变量 的 郧 数 内 进行 参阅 呢 ? 这 是 因 
为 ， 局 部 变量 是 临时 保存 在 寄存 器 和 栈 中 的 。 正 如 本 章 前 半 部 分 讲 的 
那样 ， 孔 数 内 部 利用 的 栈 ， 在 函数 处 理 完毕 后 会 恢复 到 初始 状态 ， 
此 局 部 变量 的 值 也 就 被 销毁 了 ， 而 寄存 硕 也 可 能 会 被 用 于 其 他 目的 。 
因此 ， 局 部 变量 只 是 在 旺 数 处 理 运行 期 间 临 时 存储 在 寄存 硕 和 栈 上 。 
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在 代码 清单 10-6 中 定义 了 10 个 局 部 变量 。 这 是 为 了 表示 存储 局 部 
变量 的 不 仅仅 是 栈 ， 还 有 寄存 器 。 为 确保 cl 一 c10 所 需 的 领域 ， 寄 存 器 
空闲 时 就 使 用 寄存 需 ， 寄 存 需 空间 不 足 的 话 就 使 用 栈 。 


下 面 让 我 们 来 看 一 下 代码 清单 10-7 中 TEXT 段 定义 的 内 容 。( 7 ) 
表示 的 是 MyFunc 国 数 的 范围 。 在 MyFunc 国 数 中 定义 的 局 部 变量 所 需 
要 的 内 存 领 域 ， 会 被 尽 可 能 地 分 配 在 寄存 送 中 。 大 家 可 能 会 认为 用 高 
性 能 的 寄存 带 来 代 蔡 普通 的 内 存 是 很 餐 侈 的 事情 ， 不 过 编译 带 不 会 这 
么 认为 ， 只 要 寄存 疾 有 空间 ， 编 译 带 就 会 使 用 它 。 因 为 与 内 存 相 比 ， 
使 用 寄存 锅 时 访问 速度 会 高 很 多 ， 这 样 就 可 以 更 快速 地 进行 处 理 。 局 
部 变量 利用 寄存 顺 ， 是 Borland C++ 编译 带 最 优化 的 运行 结果 。 旧 的 编 
详 希 没有 类 似 的 最 优化 功能 ， 局 部 变量 就 可 能 会 仅仅 使 用 栈 。 


代码 清单 中 的 (8 ) 表示 的 是 往 寄存 着 中 分 配 局 部 变量 的 部 分 。 仪 
仅 对 局 部 变量 进行 定义 是 不 够 的 ， 只 有 在 给 局 部 变量 赋值 时 ， 才 会 被 
分 配 到 寄存 硕 的 内 存 区 域 。( 8 ) 就 相当 于 给 5 个 局 部 变量 cl 一 c5 分 别 
赋予 数值 1~$ 这 一 处 理 。eax、edx、ecx、ebx、esi 是 Pentium 等 x86 
系列 32 位 CPU 寄存 砷 的 名 称 ( 参考 表 10-2 )。 至 于 使 用 哪 一 个 寄存 表 ， 
则 要 由 编译 需 来 决定 。 这 种 情况 下 ， 寄 存 需 只 是 被 单纯 地 用 于 存储 变 
量 的 什 ， 和 其 本 身 的 角色 没有 任何 关系 。 


x86 系列 CPU 拥有 的 寄存 器 中 ， 程 序 可 以 操作 的 有 十 几 个 。 其 中 
空闲 的 ， 最 多 也 只 有 几 个。 因而 ， 局 部 变量 数目 很 多 的 时 候 ， 可 分 配 
的 寄存 器 就 不 够 了 。 这 种 情况 下 ， 局 部 变量 就 会 申请 分 配 栈 的 内 存 空 
间 。 虽 然 栈 的 内 存 空间 也 是 作为 一 种 存储 数据 的 段 定 义 来 处 理 的 ， 但 
在 程序 各 部 分 都 可 以 共享 并 临时 使 用 这 一 点 上 ， 它 和 _DATA 段 定 义 及 
_BSS 段 定义 在 性 质 上 还 是 有 些 差异 的 。 例 如 ， 在 函数 入 口 处 为 变量 申 
请 分 配 栈 的 内 存 空间 的 话 ， 就 必须 在 函数 出 口 处 进行 释放 。 否 则 ， 经 
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过 多 次 调用 函数 后 ， 栈 的 内 存 空间 驶 会 被 用 光 了 。 


在 (8) 这 一 部 分 中 ， 给 局 部 变量 cl1~c5 分 配 完 寄存 需 后 ， 可 用 的 
寄存 器 数量 就 不 足 了 。 于 是 ， 剩 下 的 5 个 局 部 变量 c6 一 c10 就 被 分 配 了 
栈 的 内 存 空间 ， 如 (9 ) 所 示 。 拯 数 入 口 ( 10 ) 处 的 add esp,-20 指 的 是 ， 
对 栈 数据 存储 位 置 的 esp 寄存 硕 (〈 栈 指针 ) 的 值 做 减 20 的 处 理 。 为 了 
确保 内 部 变量 c6 一 c10 在 栈 中 ， 就 需要 保留 5 个 int 类 型 的 局 部 变量 
(4 字 市 x5 = 20 字 市 ) 所 需 的 空间 。( 11 ) 中 的 mov ebp,esp 这 一 处 理 ， 
指 的 是 把 当前 esp 寄存 右 的 值 复 制 到 ebp 寄存 带 中 。 之 所 以 需要 (11) 
这 一 处 理 ， 是 为 了 通过 在 浮 数 出 口 处 的 (12 ) 这 一 move esp,ebp 的 处 
理 ， 把 esp 寄存 带 的 值 还 原 到 原始 状态 ， 从 而 对 申请 分 配 的 栈 空间 进行 
释放 ， 这 时 栈 中 用 到 的 局 部 变量 就 消失 了 。 这 也 是 栈 的 清理 处 理 。 在 
使 用 寄存 融 的 情况 下 ， 局 部 变量 则 会 在 寄存 融 被 用 于 其 他 用 途 时 目 动 
消失 ( 图 10-6 )。 


未 使 用 的 . 0 
空间 申请 分 配 内 存 空间 空间 
mov ebp,esp 


-<- 串 一 一 一 
add esp,—20 
1 me 20 字 节 
esp=ebp 
一 


= 
释放 内 存 空间 


mov esp,ebp 


图 10-6 用 于 局 部 变量 的 栈 空间 的 申请 分 配 和 释放 


(9 ) 中 的 5 行 代 码 是 往 栈 空间 中 代入 数值 的 部 分 。 由 于 在 问 栈 申 
请 内 存 空间 前 ,借助 mov ebp,esp 这 个 处 理 ，esp 寄存 需 的 值 被 保存 
到 了 ebp 寄存 闫 中， 因此， 通过 使 用 [ebp - 4]、[ebp - 8]、[ebp - 12]、 
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[ebp - 16]、[ebp - 20] 这 样 的 形式 ， 就 可 以 将 申请 分 配 的 20 字 闻 的 栈 内 
存 空 间 切 分 成 5 个 长 度 分 别 是 4 字 节 的 空间 来 使 用 (图 10-7 )。 例 如 ， 
(9 ) 中 的 mov dword ptr [ebp - 4], 6 表示 的 就 是 ， 从 申请 分 配 的 内 存 空 
间 的 下 端 (ebp 寄存 硕 指 示 的 位 置 ) 开始 往 前 4 字 市 的 地 址 ( [ebp - 4] ) 
中 ， 存 储 痢 6 这 一 4 字 节 的 数据 。 


图 10-7 将 栈 的 内 存 空间 进行 分 割 


天 于 往 全 局 变量 中 代入 局 部 变量 的 数值 这 一 内 容 ， 这 里 不 再 进行 
说 明 。 这 时 可 能 有 该 者 会 产后 疑问， 既然 不 进行 说 明 ， 那 为 什么 代码 
清单 10-6 中 没有 省 略 掉 该 部 分 呢 ?” 这 是 为 了 避免 编 痒 如 的 最 优化 功能 。 
如 琳 仅 进行 定义 局 部 变量 并 代入 数值 这 一 人 处理 的 话 ， 编 详 雁 的 最 优化 
功能 就 会 后 动 ， 届 时 编 详 肖 就 会 认为 菜 些 代 码 没 有 意义 ， 从 而 导致 汇 
编 语 言 的 源 代 码 无 法 生成 。 这 样 看 来 ， 编 详 融 还 是 很 聪明 的 吧 1 


围 10.11 循环 处 理 的 实现 方法 
接 下 来 ， 让 我 们 继续 解析 汇编 语言 的 源 代码 ， 看 一 下 for 循环 及 让 
条 件 分 支 等 C 语 言 程序 的 流程 控制 是 如 何 实现 的 。 代码 清单 10-8 是 将 


Q) 通过 利用 for 语 句 及 让 语句 来 改变 程序 流程 的 机 制 称 为 “流程 控制 ”。 
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局 部 变量 i 作为 循环 计数 器 ”连续 进行 10 次 循环 的 C 语言 源 代 码 。 在 
for 语句 中 ， 调 用 了 不 做 任何 处 理 的 MySub 函数 。 这 里 我 们 把 代码 清单 
10-8 转换 成 汇编 语言 ， 然 后 仅 把 相当 于 for 处 理 的 部 分 摘出 来 ， 如 代码 
清单 10-9 所 示 。 


代码 清单 10-8 ”执行 循环 处 理 的 C 语言 源 代 码 


// 定义 MySub 函数 
vomMv Su 


// 不 做 任何 处 理 
} 


// 定义 MyFunc 函数 
Void MyFunc () 


te 
GE (1 0 1 < 10 dor ) 


// 重复 调用 MySub 函数 10 次 
MySup () ; 


代码 清单 10-9 ”将 代码 清单 10-8 中 的 for 语句 转换 成 汇编 语言 的 结果 


XOr ebx, ebx ; 将 eax 寄存 器 清 0 
@4 call _MySub ; // 调用 MySub 函数 
Ge: ebx ; //ebx 寄存 器 的 值 加 1 
cmp ED 10 ; // 将 ebx 寄存 器 的 值 和 10 进行 比较 
jl short @4 ; // 如 果 小 于 10 就 跳 转 到 @4 


C 语言 的 for 语 句 是 通过 在 括号 中 指定 循环 计数 表 的 初始 值 := 
0 )、 循 环 的 继续 条 件 (i< 10 )、 循 环 计 数 融 的 更 新 (A++ ) 这 3 种 形式 来 
进行 循环 处 理 的 。 与 此 相对 ， 在 汇编 语言 的 源 代码 中 ,循环 是 通过 比 
较 指 分 ( cmp ) 和 跳 转 指令 (jl ) 来 实现 的 。 


QD 用 来 计算 循环 次 数 的 变量 称 为 “循环 计数 器 ”。 
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下 面 就 让 我 们 按照 代码 清单 10-9 的 内 容 的 顺序 来 进行 说 明 。 
MyFunc 吨 数 中 用 到 的 局 部 变量 只 有 1， 变 量 申 请 分 配 了 ebx 寄存 需 的 
内 存 空间 。for 语句 的 括号 中 的 i=0; 被 转换 成 了 xor ebx,ebx 这 一 处 理 。 
xor 指令 会 对 左 起 第 一 个 操作 数 和 右 起 第 二 个 操作 数 进行 XOR 运算 ， 
然后 把 结 采 存储 在 第 一 个 操作 数 中 。 由 于 这 里 把 第 一 个 操作 数 和 第 二 


个 操作 数 都 指定 为 了 ebx， 因 此 就 变 成 了 对 相同 数值 进行 XOR 运算 。 
也 就 是 说 , 不 管 当前 ebx 寄存 器 的 值 是 什么 , 结果 肯定 都 是 0 。 虽 然 用 
mov 指令 的 mov ebx,0 也 会 得 到 同样 的 结果 ， 但 与 mov 指令 相 比 ，xor 
指令 的 处 理 速度 更 快 。 这 里 ， 编 译 器 的 最 优化 功能 也 会 启动 。 


ebx 寄存 需 的 值 初始 化 后 ， 会 通过 call 指令 调用 MySub 了 男 数 
(_MySub )。 从 MySub 果 数 返回 后 ， 则 会 通过 inc 指令 对 ebx 寄存 骨 的 值 
做 加 1 处 理 。 该 处 理 就 相当 于 for 语句 的 计 +，++ 是 当前 数值 加 1 的 意思 。 


下 一 行 的 cmp 指令 是 用 来 对 第 一 个 操作 数 和 第 二 个 操作 数 的 数值 
进行 比较 的 指令 。cmp ebx,10 就 相当 于 C 语言 的 入 10 这 一 处 理 ， 意 思 
是 把 ebx 寄存 需 的 数值 同 10 进行 比较 。 汇 编 语 言 中 比较 指令 的 结果 ， 
会 存储 在 CPU 的 标志 寄存 带 中 。 不 过 ， 标 志 寄 存 带 的 值 ， 程 序 是 无 法 
下 接 参考 的 。 那 么 ,程序 是 怎么 来 判断 比较 结果 的 呢 ? 


实际 上 ， 汇 编 语言 中 有 多 个 跳 转 指令 ， 这 些 跳 转 指令 会 根据 标志 
寄存 需 的 值 来 判定 是 否 需 要 跳 转 。 例 如 ， 最 后 一 行 的 ji， 是 jump on 
less than (小 于 的 话 就 跳 转 ) 的 意思 。 也 就 是 说 ，jLshort @4 的 意思 就 
是 ， 前 面 运 行 的 比较 指令 的 结果 硅 “ 小 ”的 话 就 跳 转 到 @4 这 个 标签 。 


QD 相同 数值 进行 XOR 运算 ， 运算 结果 为 0。XOR 运算 的 规则 是 ， 值 不 同时 
结果 为 1， 值 相同 时 结果 为 0。 例 如, 01010101 和 01010101 进行 XOR 运算 
的 话 ， 就 会 分 别 对 该 数字 的 各 数字 位 进行 XOR 运算 。 因 为 这 两 个 数 的 每 个 
位 都 相同 ， 因 此 ,运算 结果 就 是 00000000。 
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代码 清单 10-10 是 按照 代码 清单 10-9 中 汇编 语言 源 代 码 的 处 理 顺 
序 重 与 的 C 语言 源 代码 (由 于 C 语 言 中 无 法 使 用 @ 字符 开头 的 标签 ， 
因此 这 里 用 了 L4 这 个 标签 名 )， 也 是 对 程序 实际 运行 过 程 的 一 个 直接 
描述 。 不 过 看 来 看 去 还 是 觉得 使 用 for 语句 的 代码 清单 10-8 的 源 代码 
更 智能 些 。 人 们 经 稼 说 “汇编 语言 是 对 CPU 的 实际 运行 进行 二 接 摘 述 
的 低级 编程 语言 ，C 语言 是 用 与 人 类 的 感觉 相近 的 表现 来 描述 的 融 级 编 


程 语 言 ， 此 时 ， 想 必 大 家 都 能 深切 体会 这 句 话 的 意思 了 吧 。 此 外 ， 代 
三 清单 10-10 的 第 一 行 中 的 =i， 意 思 是 对 i 和 i 进行 XOR 运算 ， 并 把 
结果 代入 为 了 和 汇编 语言 的 源 代码 进行 同样 的 处 理 ， 这 里 把 将 变量 
i 的 值 清 0 这 一 处 理 ， 通 过 对 变量 i 和 变量 i 进行 XOR 运算 来 实现 了 。 
借助 让 =i,， i 的 值 就 变 成 了 0。 

代码 清单 10-10 ”用 C 语言 来 表示 代码 清单 10-9 的 处理 顺 序 

L4: ee 


i++; 
Ee (1 < 110) Gt L424 


国 10.12 条 件 分 支 的 实现 方法 

下 面 让 我 们 来 看 一 下 条 件 分 文 的 实现 方法 。 条 件 分 文 的 实现 方法 
同 循环 处 理 的 实现 方法 类 似 ， 使 用 的 也 是 cmp 指令 和 跳 转 指令 ， 这 一 
点 估计 大 家 也 预料 到 了 。 


没 错 ， 条 件 分 支 就 是 利用 这 些 指令 来 实现 的 。 不 过 ， 为 了 以 防 万 
一 ， 我 们 来 确认 一 下 。 代 码 清单 10-11 是 ， 根 据 变量 a 的 值 来 调用 不 同 
子 数 (MySubl 困 数 、MySub2 函数 、MySub3 函数 ) 的 C 语言 源 代 码 。 
为 了 实现 条 件 分 支 ， 这 里 使 用 了 站 语句 。 示 例 中 被 调用 的 各 个 函数 ， 
都 不 进行 任何 处 理 。 将 代码 清单 10-11 的 MyFunc 函数 处 理 转换 成 汇编 
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一 
A 
人 


人 ee an NG 


语言 源 代 码 后 ， 结 果 就 如 代码 清单 10-12 所 示 。 


代码 清单 10-11 进行 条 件 分 支 的 C 语言 源 代码 


// 定义 MySubl 函数 
vemos un 


| 
| 


// 定义 MySub2 函数 
void MySup2 () 


人 
} 


// 定义 MySupb3 函数 
void MySup3 () 


// 不 做 任何 处 理 


// 不 做 任何 处 理 


// 不 做 任何 处 理 
} 


// 定义 MyFunc 函数 
void MyFunc ( ) 


( 
ifm 已 国王 i123 
// 根据 条 件 调用 不 同 的 函数 
E (全 三 工 0O0) 


人 
} 


else if (a < 50) 


{ 
} 
else 


{ 
} 


MySubl1 () ; 


MySub2 () ; 


MySub3 () ; 


代码 清单 10-12 ”将 代码 清单 10-11 的 MyFunc 函数 转换 成 汇编 语言 后 的 结果 


ME nae asele een 
push ebp; 
mOV ebp,esp; 
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mov eax, 123 ; 把 123 存 入 eax 寄存 器 中 


cmp ET ; 把 eax 寄存 器 的 值 同 100 进行 比较 
Te short @8 ; 比 100 小 时 ， 跳 转 到 @8 标签 
call MySudl ; 调用 MySubl 函数 
jmp SnorE coll ; 跳 转 到 @11 标签 

@8: cmp eax, 50 ; 把 eax 寄存 器 的 值 同 50 进行 比较 
je short @10 ; 大 于 50 时， 跳 转 到 @10 标签 
call MySub2 ; 调用 MySub2 函数 
jmp Short ol ; 跳 转 到 @11 标签 

@10: call MySub3 ; 调用 MySub4 函数 

@11: pop ebp 
人 全 加 

_MyFunc Eee 


代码 清单 10-12 中 用 到 了 三 种 跳 转 指令 ， 分 别 是 比较 结 采 小 时 跳 转 
的 jle (jump on less or equal )、 大 时 跳 转 的 jge (jump on greater or 
equal )、 不 管 结果 怎样 都 无 条 件 跳 转 的 jmp。 在 这 些 跳 转 指令 之 前 还 有 
用 来 比较 的 cmp 指令， 比较 结果 被 保存 在 了 标志 寄存 如 中 。 这 里 我 们 
添加 了 注释 ， 大 家 不 妨 顺 着 程序 的 流程 看 一 下 。 虽 然 同 C 语言 源 代码 
的 处 理 流 程 不 完全 相同 ， 不 过 大 家 应 该 知道 处 理 绪 采 是 相同 的 。 此 外 ， 
还 有 一 点 需要 注意 的 是 ，eax 寄存 般 表 示 的 是 变量 a。 


里 然 大 部 分 的 C 语言 参考 书 中 都 写 大 “为 1 便于 理解 程序 的 结构 ， 
应 尽量 避免 使 用 无 条 件 分 文 的 goto 语句 ”"， 不 过 ， 在 汇编 语言 这 一 领域 
中 ， 如 果 不 使 用 相当 于 C 语言 goto 语句 的 jmp 指令 ， 就 无 法 实现 循环 
和 条 件 分 文 。 由 此 看 来 ， 关 于 应 不 应 该 在 C 语言 中 使 用 goto 语句 ， 大 
家 没有 必要 这 么 案 张 。 


转 10.13 了 解 程序 运行 方式 的 必要 性 

通过 对 C 语 言 源 代码 和 汇编 语言 源 代码 进行 比较 ， 想 必 大 家 对 
“程序 是 怎样 跑 起 来 的 ”又 有 了 更 深 的 理解 。 而 且 ， 从 汇编 语言 源 代码 
中 获得 的 知识 ， 在 某 些 情况 下 对 查找 bug 的 原因 也 是 有 帮助 的 。 
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让 我 们 来 看 个 示例 。 代 码 清单 10-13 是 更 新 全 局 变量 counter 的 值 
的 C 语 言 程 序 。MyFuncl 困 数 和 MyFunc2 因数 的 处 理 内 容 ， 都 是 把 全 
局 变量 counter 的 值 放 大 到 2 倍 。counter *= 2 ; 指 的 是 把 counter 的 数 
值 乘 以 2， 然 后 再 把 所 得 结果 赋值 到 counter 的 意思 。 这 里 ， 假 设 我 们 
利用 多 线程 处 理 ,同时 调用 了 一 次 MyFuncl 图 数 和 MyFunc2 咕 数 。 这 
时 ， 全 局 变量 counter 的 数值 ， 理 应 变 成 100 x2 x2 = 400。 然 而 ， 某 些 
时 候 结 末 也 可 能 会 是 200。 至 于 为 什么 会 出 现 该 bug， 如 采 没 有 调查 过 
汇编 语言 的 源 代码 ， 也 就 是 说 如 果 对 程序 的 实际 运行 方式 不 了 解 的 话 ， 
是 很 难 找到 其 原因 的 。 


代码 清单 10-13 ”两 个 函数 更 新 同一 个 全 局 变量 数值 的 C 语言 程序 
// 定义 全 局 变量 


ne oounter = 0o0: 


// 定义 MyFunc1l 函数 
void MyFuncl () 


Somme 2 


} 


// 定义 MyFunc2 函数 
void MyFunc2 () 


{ 


QOLECl 2 


} 


将 代码 清单 10-13 的 counter *= 2; 部 分 转换 成 汇编 语言 源 代 码 后 ， 
结果 就 如 代码 清单 10-14 所 示 。 这 里 希望 大 家 注意 的 是 ，C 语言 源 代 码 
中 counter *= 2; 这 一 个 指令 的 部 分 ， 在 汇编 语言 源 代码 ， 也 就 是 实际 运 
行 的 程序 中 ， 分 成 了 3 个 指令 。 如 果 只 是 看 counter *= 2; 的 话 ， 束 会 以 
为 counter 的 数值 被 直接 扩大 为 了 原来 的 2 倍 。 然 而 ， 实 际 上 执行 的 却 


Q) “线程 ”是 操作 系统 分 配给 CPU 的 最 小 运行 单位 。 源 代码 的 一 个 函数 就 相 
当 于 一 个 线程 。 多 线程 处 理 指 的 是 在 一 个 程序 中 同时 运行 多 个 函数 的 意思 。 
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是 “把 counter 的 数值 谈 入 eax 寄存 希 ”“ 将 eax 寄存 需 的 数值 变 成 原来 
的 2 倍 "”“ 把 eax 寄存 需 的 数值 写 人 counter” 这 3 个 处 理 。 


代码 清单 10-14 ”将 全 局 变量 的 值 翻 倍 这 一 部 分 转换 成 汇编 语言 源 代码 的 结果 
mov eax,dword ptr[ counter] ; 将 counter 的 值 读 入 eax 寄存 器 
5 ; 将 eax 寄存 器 的 值 扩 大 至 原来 的 2 倍 


mov dword ptr[ _counter] ,eax ; 将 eax 寄存 器 的 数值 分 入 counter 中 


在 多 线程 处 理 中 ， 用 汇编 语言 记述 的 代码 每 运行 1 行 ， 处理 都 有 
可 能 切换 到 其 他 线程 (函数 ) 中 。 因 而 ,假设 MyFuncl 冰 数 在 谈 出 
counter 的 数值 100 后 ， 还 未 来 得 及 将 它 的 2 倍 值 200 写 和 人 counter 时 ， 
正巧 MyFunc2 国 数 读 出 了 covnter 的 数值 100， 那 么 结果 就 会 导致 
counter 的 数值 变 成 了 200 (图 10-8 )。 


多 线程 处 理 中 (1) ~ (6) 的 处 理 交 互 运行 


| 


MyFunc1 函 数 全 局 变量 MyFunc2 函 数 


GoOunier 
( 1 ) 读 出 counter 的 数值 初始 值 ( 2 ) 读 出 counter 的 数值 
( 3 ) 将 读 出 的 数值 放大 100 200_ (4 ) 将 读 出 的 数值 放大 
到 原来 的 2 倍 更 新 后 到 原来 的 2 倍 
(5 ) 写 入 结果 200 (6 ) 写 入 结果 


图 10-8 100x2x2 的 结果 成 200 的 过 程 


为 了 避免 该 bug， 我 们 可 以 采用 以 函数 或 C 语言 源 代码 的 行为 单位 
来 茶 止 线程 切换 的 锁定 方法 。 通 过 锁定 ， 在 特定 范围 内 的 处 理 完 成 之 
前 ， 处 理 不 会 被 切换 到 其 他 函数 中 。 至 于 为 什么 要 锁定 MyFuncl 函数 
和 MyFunc2 函数 ， 大 家 如 果 不 了 解 汇 编 语 言 源 代码 的 话 想 必 是 不 明日 
的 吧 。 
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现在 基本 上 没有 人 用 汇编 语言 来 编写 程序 了 。 因 为 C 语言 等 高 级 
编程 语言 用 1 行 束 可 以 完成 的 处 理 , 使 用 汇编 语言 的 话 有 时 就 需要 多 
行 ， 效 率 很 低 。 不 过 ， 汇 编 语 言 的 经 验 还 是 很 重要 的 。 因 为 信 助 汇编 


语言 ， 我 们 可 以 更 好 地 了 解 计算 机 的 机 制 。 特 别 是 对 专业 程序 员 来 说 ， 
至 少 要 有 一 次 使 用 汇编 语言 的 经 验 


下 面 让 我 们 以 开车 为 例 进行 说 明 。 没 有 汇编 语言 经 验 的 程序 员 ， 
网 相当 于 只 知道 汽车 的 区 驶 方法 而 不 了 解 汽 车 纺 构 的 驾驶 员 。 对 这 样 
的 区 驶 员 来 说 ， 如 朱 汽 车 出 现 了 故障 或 奇怪 的 现象 ， 他 们 就 无 法 目 己 
找到 原因 。 不 了 解 汽车 结构 的 话 ， 开 和 车 的 时 候 还 可 能 会 浪费 油 。 这 样 
的 话 ， 作 为 职业 区 驶 员 是 不 合格 的 。 与 此 相对 ， 有 汇编 语言 经 验 的 程 
序 员 ， 也 驶 相当 于 了 解 计算 机 和 程序 机 制 的 驾驶 员 ， 他 们 不 仅 能 目 己 
解决 问题 ， 还 能 在 驾驶 过 程 中 省 油 。 


本 章 的 内 容 确 实 有 些 绕 ,但 是 对 了 解 计算 机 和 程序 的 实际 运行 方 
式 来 说 ， 体 验 汇编 语言 是 最 有 效 的 。 如 末 大 家 会 使 用 C 语言 的 话 ， 硕 
望 大 家 对 C 语言 的 各 种 语法 所 对 应 的 汇编 语言 都 一 一 确认 一 下 。 最 好 
能 编写 一 些 简短 的 程序 来 进行 反复 的 测试 。 笔 者 目 身 也 是 通过 进行 这 
些 符 试 才 使 目 己 的 编程 技能 有 了 大 幅 提高 的 。 


下 一 音 ， 我 们 将 会 对 VO 端口 的 输入 输出 及 中 断 处 理 等 用 程序 来 控 
制 便 件 的 方法 进行 说 明 ， 同 时 也 会 介绍 一 个 使 用 汇编 语言 的 示例 程序 。 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 @ 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


ES 
一 = 一 
AAA me eh 


9 类 | 身 | 问 | 答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


1. 在 汇编 语言 中 ， 是 用 什么 指令 来 同 外 围 设 备 进行 输入 输出 操 
作 的 ? 

. I/O 是 什么 的 缩写 ? 

. 用 来 识别 外 围 设备 的 编号 称 为 什么 ? 

. IRQ 是 什么 的 缩写 ? 

. DMA 是 什么 的 缩写 ? 

. 用 来 识别 具有 DMA 功能 的 外 围 设备 的 编号 称 为 什么 ? 


OO Ol 上 记 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


. IN 指令 和 OUT 指令 

. Input/Output 

. |/O 地 址 或 VO 端口 号 

. Interrupt Request 

. Direct Memory Access 
. DMA 通道 


. 在 x86 系列 CPU 用 的 汇编 语言 中 ， 通 过 IN 指令 来 实现 IO 输 


人 ，OUT 指令 来 实现 VO 输出 。 


.用 来 实现 计算 机 主机 和 外 围 设备 输入 输出 交互 的 IC 称 为 IO 控 


制 硕 或 徐 称 为 IO。 


.所 有 连接 到 计算 机 的 外 围 设备 都 会 分 配 一 个 IO 地 址 编号 。 
. IRQ 指 的 是 用 来 执行 便 件 中 断 请 求 的 编号 。 
. DMA 指 的 是 ,不 经 过 CPU 中 介 人 处 理 ， 外 围 设备 直接 同 计算 机 


的 主 内 存 进行 数据 传输 。 


， 像 磁盘 这 样 用 来 处 理 大 量 数据 的 外 围 设 备 都 具有 DMA 功能 。 
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“计算 机 如 果 没 有 软件 ， 就 仅仅 是 个 箱子 ”这 个 该 
谐 的 描述 大 家 都 知道 吧 ? 也 就 是 说 ， 即 使 是 计算 机 这 
种 看 起 来 很 了 不 起 的 设备 ( 硬件 )， 离 开 了 软件 依然 什么 也 做 不 了 。 虽 
然 这 句 话 极 具 讽 刺 意 味 ， 不 过 也 正 惟 到 了 计算 机 的 本 质 。 因 为 软件 的 
存在 是 硬件 正常 运行 的 必要 条 件 。 通 过 前 面 的 章 忆 我 们 已 经 知道 ， 控 
制 CPU， 只 需 把 编译 器 或 汇编 器 生成 的 本 地 代码 加 载 到 主 内 存 并 运行 
就 可 以 了 。 那 么 ， 如 何 用 程序 来 控制 CPU 和 主 内 存 以 外 的 硬件 呢 ? 本 
章 我 们 就 会 对 这 个 问题 进行 解答 。 


围 11.1 应 用 和 硬件 无 关 ? 

在 用 C 语言 等 高 级 编程 语言 开发 的 Windows 应 用 中 ， 大 家 很 少 能 
接触 到 下 接 控 制 便 件 的 指令 。 这 是 因为 便 件 的 控制 是 由 Windows 全 权 
负责 的 。 


不 过 ，Windows 提供 了 通 
过 应 用 来 间接 控制 硬件 的 方法 。 应 用 


| | 调用 AP| 
Winows ( 操作 系统 ) | 


利用 操作 系统 提供 的 系统 调 
用 功能 就 可 以 实现 对 硬件 的 控 
制 。 在 Windows 中 ， 系 统 调 用 
称 为 API (图 111) 各 API 就 OU 站 
是 应 用 调用 的 函数 。 这 些 函 数 硬件 ] 
的 实体 被 存储 在 DLL 文件 中 。 
下 面 让 我 们 来 看 一 个 利用 
系统 调用 来 间接 控制 硬件 的 示例 。 例 如 ， 假 设 要 在 窗口 中 显示 字符 串 ， 


图 11-1 应 用 通过 操作 系统 间接 控制 硬件 


图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 省 


就 可 以 使 用 Windows API 中 的 TextOut 函数 ”。TextOut 的 语法 如 代码 清 
单 11-1 所 示 。 在 这 段 代码 中 ,确实 没有 能 让 大 家 意识 到 人 硬件 的 参数 。 
之 有 “设备 描述 表 的 句柄 ”这 一 注释 的 参数 hdc， 是 用 来 指定 字符 串 及 
图 形 等 绘制 对 象 的 识别 但 ， 表 示 的 也 不 是 直接 硬件 设备 。 


代码 清单 11-1 TextOut 函数 的 语法 ( C 语言 ) 


BOOL TextOut ( 


HDC hae, // 设备 描述 表 的 句柄 
TS // 显示 字符 串 的 xx 坐标 
LE Tyotart // 显示 字符 串 的 y 坐标 
LPCTOTR lbStrine, // 指向 字符 串 的 指针 
ES // 字符 串 的 文字 数 


那么 ， 在 处 理 TextOut 函数 的 内 容 时 ，Windows 做 了 什么 呢 ?” 从 结 
果 来 看 ，Windows 直接 控制 了 作为 硬件 的 显示 融 。 但 Windows 本 号 也 
是 软件 ， 由 此 可 见 ，Windows 应 该 回 CPU 传递 了 有 某 些 指令 ， 从 而 通过 
软件 控制 了 硬件 。 


圈 11.2 支撑 硬件 输入 输出 的 IN 指令 和 OUT 指令 
Window 控制 硬件 时 借助 的 是 输入 输出 指令 。 其 中 具有 代表 性 的 
两 个 输入 输出 指令 就 是 IN 和 OUT。 这 些 指令 也 是 汇编 语言 的 助 


A 


但 人 和 


IN 指令 和 OUT 指令 的 语法 如 图 11-2 所 示 。 这 是 Pentium 等 x86 
系列 CPU 用 的 IN 指令 和 OUT 指令 的 语法 。IN 指令 通过 指定 端口 号 的 
端口 输入 数据 ， 并 将 其 存储 在 CPU 内 部 的 寄存 器 中 。OUT 指令 则 是 把 
QD) 在 向 窗口 和 打印 机 输出 字符 串 时 ， 可 以 使 用 Windows 提供 的 TextOut 函数 


作为 API。C 语言 提供 的 printf 函数 ， 是 用 来 在 命令 提示 符 中 显示 字符 串 的 
函数 。 使 用 printf 函数 ， 是 无 法 向 窗口 和 打印 机 输出 字符 串 的 。 
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CPU 寄存 融 中 存储 的 数据 ， 输 出 到 指定 端口 号 的 端口 。 


IN ] 寄存 器 名 ， 端 口号 ] 


令 ”输入 数据 


our | 疹 口 号 ， 寄 存 器 名 


令 。 输出 数据 


、 图 11-2_ 必 指令 和 OUT 指令 的 语法 


下 面 让 我 们 来 看 一 下 端口 号 和 端口 到 瓜 是 什么 。 计 算 机 主机 中 ， 
附 寓 了 用 来 连接 显示 毅 及 键盘 等 外 玮 设备 的 连接 硕 。 而 各 连接 禹 的 内 
部 ， 都 连接 有 用 来 交换 计算 机 主机 同 外 围 设 备 之 间 电 流 特性 的 IC。 这 
些 IJC， 统 称 为 VO 控制 器 。 由 于 电压 不 同 ， 数 字 信 号 及 模拟 信号 的 电 
流 特性 也 不 同 ， 计 算 机 主机 和 外 围 设备 是 无 法 直接 连接 的 。 为 了 解决 
这 个 问题 ，VO 控制 副 就 很 有 必要 了 了。 


IO 是 Input/Output 的 缩写 。 显 示 带 、 键 盘 等 外 围 设备 都 有 各 日 专 
用 的 IO 控制 部 。LO 控制 融 中 有 用 于 临时 保存 输入 输出 数据 的 内 存 。 
这 个 内 存 就 是 端口 。 端 口 (port ) 的 字面 意思 是 “港口 ”。 由 于 端口 束 
像 是 在 计算 机 主机 和 外 围 设备 之 间 进 行 贫 物 (数据 ) 痛 贸 的 港口 ， 所 
以 因此 得 名 。1O 控制 硕 内 部 的 内 存 ， 也 称 为 寄存 第。 虽然 都 是 寄存 
人 从， 但 它 和 CPU 内 部 的 寄存 硕 在 功能 上 是 不 同 的 。CPU 内 部 的 寄存 
融 是 用 来 进行 数据 运算 处 理 的 ， 而 VO 寄存 融 则 主要 是 用 来 临时 存储 
数据 的 。 


在 实现 IO 控制 天 功能 的 IC 中 ， 会 有 多 个 端口 。 由 于 计算 机 中 连 
接着 很 多 外 围 设备 ， 所 以 就 会 有 多 个 IO 控制 部 ， 当 然 也 会 有 多 个 端 
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口 。 一 个 VO 控制 器 既 可 以 控制 一 个 外 围 设 备 ， 也 可 以 控制 多 个 外 围 
设备 。 各 端口 之 间 通 过 端口 号 进行 区 分 。 端 口号 也 称 为 VO 地址。 
IN 指令 和 OUT | $ 在 端口 号 指定 的 端口 和 CPU opel 
输入 输出 。 这 和 通过 内 存 地 址 来 进行 主 内 存 的 读 写 是 一 样 的 道 
(图 11-3 )。 


Cpy 用 于 键盘 的 /OQ ( 端口 号 xxxx、 yyyy ) 


电流 特性 的 转换 


导语 而 加 2 


电流 特性 的 转换 


图 11-3 ”以 端口 为 桥梁 来 实现 CPU 和 外 围 设备 之 间 的 数据 传递 


通过 Windows 的 控制 面板 ， 我 们 可 以 查看 外 围 设 备 所 连接 的 IO 
控制 器 的 端口 号 。 图 11-4 是 通过 Windows 控制 面板 来 查看 软盘 驱动 控 
制 器 的 属性 时 的 情况 “。“1O 的 范围 ” 右 侧 的 数值 就 是 端口 号 。 通 过 指 
定 该 端口 号 ， 并 利用 INOUT 命令 ， 就 可 以 直接 控制 软驱 这 个 硬件 设 
备 ， 实 现 输 入 输出 处 理 了 。 


@ LO 装置， 有 的 直接 附带 在 计算 机 主机 的 主板 ( 用 来 放置 CPU 的 基板 ) 上， 
有 的 则 是 各 自 独 立 的 扩张 板 卡 。 键 盘 、 和 鼠标 、 打 印 机 等 常用 的 IO， 一 般 都 
在 主板 上 ， 而 显示 高 速 图 形 的 显示 器 及 网 卡 等 特殊 的 IO， 通常 是 独立 的 扩 
张 板 卡 。 

@) 近年 来 软驱 已 经 不 是 标 配 了 ，Win7 后 的 版 本 中 ， 可 以 通过 控制 面板 一 系统 
安全 一 系统 一 设备 管理 查看 。 译 者 注 
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1 4 到 站 二 尼 | 1 古巴 司 乓 
声 标准 软盘 控制 器 


资 彰 设置 (R): 


资源 类 型 。 设置 


攻 L0 范围 
徕 I70 范围 03F7 - 03F7 
加 


设 次 基于 的) ; 
使 用 自动 设置 加 


:中 这 上 划 列表 
党 有 :中 只 。 


图 11-4 通过 控制 面板 查看 软盘 驱动 器 的 端口 号 


11.3 ”编写 测试 用 的 输入 输出 程序 

首先 让 我 们 利用 JIN 指令 和 OUT 指令 ， 来 进行 一 个 直接 控制 硬件 
的 试验 。 假 设 该 试验 的 目的 是 让 计算 机 内 配置 的 蜂 鸣 器 ( 小 喇叭 ) 发 
音 。 虽 然 蜂 鸣 器 内 置 在 计算 机 内 部 ， 但 其 本 身 也 是 外 围 设 备 的 一 种 。 
因为 就 算是 把 蜂 鸣 器 取出 ， 对 计算 机 主机 也 不 会 有 什么 影响 。 


由 于 用 汇编 语言 编写 程序 比较 麻烦 ， 因 此 这 里 我 们 采取 在 C 语言 
源 代 码 中 插入 助 记 符 的 方式 来 实现 。 在 大 部 分 C 语言 的 处 理 (编译 此 
的 种 类 ) 中 ， 只 要 使 用 _asm{ 和 } 括 起 来 ,就 可 以 在 其 中 记述 助 记 符 。 
也 驶 是 说 ， 这 样 就 可 以 编写 C 语言 和 汇编 语言 混合 的 源 代 人 码 。 这 里 ， 
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我 们 使 用 微软 的 Visual C++ 来 作成 应 用 


在 AT 兼容 机 中 ， | 表示 的 
是 十 六 进 制 数 ( Hexadecimal ) 的 意思 ) 用 JIN 指令 通过 该 端口 号 输入 
数据 ， 并 将 数据 的 低 2 位 六 epee 
令 输出 数据 ， 这 时 蜂 鸣 希 就 会 啊 起 来 。 采 用 同样 的 操作 方法 ， 将 数据 
的 低 2 位 设 定 为 OFF 并 输出 后 ， 蜂 鸣 釉 驶 停止 了 。 


位 设 定 为 ON 指 的 是 将 该 位 t ee 
位 设 定 为 0。 把 位 设 定 为 ON， 只 需 把 想 要 设 定 为 ON 的 位 设 定 为 1， 
其 他 位 设 定 为 0 后 进行 OR 运算 即 可 。 4 文 里 需要 把 低 2 位置 为 1， 
因此 就 是 和 03H 进行 OR 运算 。03H 用 8 位 二 进 制 数 来 表示 的 话 是 
00000011。 由 于 即便 高 6 位 存在 者 具体 意义 ， 和 0 进行 OR 运算 后 也 不 
会 发 生变 化 ， 因 而 就 和 03H 进行 OR 运算 。 把 位 设 定 为 OFF， 只 需 把 
想 要 置 OFF 的 位 设 定 为 0， 其 他 位 设 定 为 1 后 进行 AND 运算 即 可 。 由 
于 这 里 需要 把 低 2 位 设 定 为 0， 因 此 就 要 和 FCH 进行 AND 运算 。 在 源 
代码 中 ，FCH 是 用 OFCH 来 记述 的 。 在 前 面 加 0 是 汇编 语言 的 规定 ， 
表示 的 是 以 A~F 这 些 字符 开头 的 十 六 进 制 数 是 数值 的 意思 。0FCH 用 
8 位 二 进 制 数 来 表示 的 话 是 11111100。 由 于 即便 高 6 位 存在 着 具体 意 
义 ， 和 1 进行 AND 运算 后 也 不 会 产生 变化 ， 因 而 就 是 同 OFCH 进行 
OR 运算 (代码 清单 11-2 )。 


代码 清单 11-2 利用 IN/OUT 指令 来 控制 蜂 鸣 器 的 程序 示例 
Se 
7 


imEeE 1; 


// 蜂 鸣 器 发 声 


QD) 可 以 免费 下 载 的 Borland C++ 5.5,， 不 支持 加 入 了 汇编 语言 的 源 代 码 的 编译 。 


使 用 该 版 本 时 需要 购买 特定 的 汇编 器 。 因 此 这 里 我 们 用 的 是 Visual C++ 6.0。 
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_asm { 
IN EAX, 61H ] 


OR EAX, 03H (IDD 


Un 
} 


// 等 待 一 段 时 间 
tc LEIUUUUUOE 02 


// 蜂 鸣 器 停止 发 声 


_asm { 
INNER ES | 


AND EAX, OFCH (3) 


OUT 61H, EAX ] 
} 


接 下 来 就 让 我 们 对 代码 清单 11-2 进行 详细 说 明 。main 是 位 于 C 语 言 
程序 运行 起 始 位 置 的 函数 。 在 该 限 数 中 ， 有 两 个 用 _asm{ 和 } 围 起 来 的 
部 分 ， 它 们 中 间 有 一 个 使 用 for 语 法 的 空 循环 (不 做 任何 处 理 的 循环 )。 


(1 ) 部 分 是 控制 蜂 鸣 硕 发 音 的 部 分 。 首 先 ， 通 过 IN EAX,61H ( 助 
记 符 不 区 1 a ) Wn 把 端口 61H 的 数据 存储 到 CPU 的 EAX 寄 
存 器 中 。 接 下 来 ， 通 过 OR EAX,03H 指令 ， 把 EAX 寄存 器 的 低 2 位 设 
ON 地 过 OUT HEAK 失信 把 ENRK 才 丰 几 
出 到 61 号 端口 ， 使 蜂 鸣 器 开始 发 音 。 虽 然 EAX 寄存 带 的 长 度 是 32 
位 ， 不 过 由 于 蜂 鸣 器 端口 是 8 位 ， 所 以 只 需 对 下 8 位 进行 OR 运算 和 
AND 运算 就 可 以 正常 运行 了 。 


(2 ) 部 分 是 一 个 重复 100 万 次 的 空 循环 ， 主 要 是 为 了 在 蜂 鸣 器 开 
始 发 音 和 停止 发 音 之 间 稍 微 加 上 一 些 时 间 间 隔 。 因 为 现在 计算 机 的 
CPU 运行 速度 非常 快 ， 哪 怕 是 100 万 次 的 循环 ， 也 几乎 是 瞬间 完成 的 。 
(3 ) 部 分 是 用 来 控制 蜂 鸣 需 发 音 停止 的 部 分 。 首 先 ， 通 过 HI 
EAX,61H 指令 ， 把 端口 61H 的 数据 存储 到 CPU 的 EAX fety 接 
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下 来 ， 通 过 AND EAX,OFCH 指令 ， 把 EAX 寄存 天 的 低 2 位 设 定 成 
0 通过 OUT 61H,EAX 指令 ， 把 寄存 带 EAX 的 内 容 输 出 到 
61 号 端口 ， 使 蜂 鸣 关 保 止 发 音 。 大 家 可 以 把 61H 端口 的 低 2 位 认为 是 
蜂 鸣 需 的 开关 。 


最 后 ， 让 我 们 对 代码 清单 11-2 进行 编译 ， 并 尝试 运行 一 下 。 这 时 ， 
蜂 鸣 顺 应 该 会 发 出 “ 跑 !” 的 短促 声音 。 此 外 ， 有 一 点 需要 注意 的 是 ， 
该 程序 虽然 在 旧版 本 Windows ( 95、98 ) 中 可 以 正常 运行 ， 但 在 这 以 后 
的 Windows( XP、Vista 等 ) 版 本 中 是 无 法 正常 运行 的 。 这 是 因为 ， 为 
了 保护 系统 安全 ， 现 在 的 Windows 禁止 了 应 用 直接 控制 硬件 的 方式 。 
如 果 将 该 程序 在 最 近 的 Windows 版 本 上 运行 的 话 ， 就 会 出 现 如 图 11-5 
所 示 的 错误 信息 ， 而 且 蜂 鸣 器 也 不 会 发 出 声音 。 


Sample5.exe 已 停止 工作 


| 出 现 了 一 个 问题 ， 导致 程序 停止 正常 工作 。 如 果 有 可 用 的 解决 
方 宾 ，Windows 将 关闭 程序 并 通知 您 。 


图 11-5 ”由 于 现在 的 Windows 禁止 应 用 直接 控制 硬件 ， 因 而 出 现 了 错误 信息 


围 11.4 外 围 设备 的 中 断 请 求 


让 我 们 再 来 看 一 下 图 11-4。 在 “IO 范围 ”下 面 有 一 个 “IRQ” 项 
日 ， 对 应 的 值 是 0x00000006 ( 06 )。IRQ ( Interrupt Request ) 是 中 断 请 
求 的 和 意思。 那么 ， 耻 Q 主要 是 用 来 做 什么 的 呢 ? 


IRQ 是 用 来 暂 集 当前 正在 运行 的 程序 ， 并 跳 转 到 其 他 程序 运行 的 
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必要 机 制 。 该 机 制 称 为 中 断 处 理 。 中 上 断 处 理 在 硬件 控制 中 担当 着 重要 角 
色 。 因 为 如 采 没 有 中 断 处 理 ， 就 有 可 能 出 现 处 理 无 法 顺畅 进行 的 情况 。 


从 中 断 处 理 开始 到 请 求 中 断 的 程序 (中断 处 理 程序 ) 运行 结束 之 
前 ， 被 中 断 的 程序 ( 主 程序 ) 的 处 理 是 停止 的 。 这 种 情况 就 类 似 于 在 处 
理 文档 的 过 程 中 有 电话 打 进 来 ， 电 话 就 相当 于 中 断 处 理 。 假 如 没有 中 
呈 功 能 的 话 ， 就 必须 等 到 文档 处 理 完毕 才 可 以 接听 电话 。 这 样 就 太 不 
方便 了 7。 由 此 可 见 ， 中断 处 理 有 着 很 大 的 价值 。 就 像 接 听 完 电话 后 返 
回 到 原来 的 文档 作业 一 样 ， 中 断 处 理 程序 运行 结束 后 ， 人 处 理 也 会 返回 
到 主 程序 中 继续 ( 图 11-6 )。 


处 理 文档 = 主 程序 


接 电话 = 中 断 处 理 
程序 


图 11-6 ”中 断 处 理 就 类 似 于 在 处 理 文档 时 接 电话 


实施 中 断 请 求 的 是 连接 外 围 设备 的 IO 控制 器 ， 负 责 实施 中 断 处 理 
程序 的 是 CPU。 为 了 进行 区 分 ， 外 围 设备 的 中 断 请 求 会 使 用 不 同 于 IO 
端口 的 其 他 编号 ， 该 编号 称 为 中 断 编号 。 在 控制 面板 中 查看 软盘 驱动 
器 的 属性 时 ，IRQ 处 显示 的 数值 06， 表 示 的 就 是 用 06 号 来 识别 软盘 驱 
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动 器 发 出 的 中 断 请 求 。 另 一 方面 ， 操 作 系统 及 BIOS 则 会 提供 响应 中 
断 纺 号 的 中 断 处 理 程序 。 


假如 同时 有 多 个 外 围 设 备 进 行 中 断 请 求 的 话 ，CPU 也 会 为 难 。 为 
此 ， 我 们 可 以 在 IO 控制 器 和 CPU 中 间 加 入 名 为 中 断 控制 器 的 IC 来 进 
行 缓冲 。 中 断 控制 右 会 把 从 多 个 外 于 设备 发 出 的 中 断 请 求 有 序 地 传递 
给 CPU。 大 家 对 中 晰 控制 器 的 认识 可 能 比较 薄弱 ， 不 过 只 需 了 解 该 设 
备 的 存在 和 角色 就 可 以 了 (网 11-7 )。 


安 照 顺序 传达 给 CPU 


中 断 控制 器 | 新 控制 器 


EL 
中 断 请 求 xx 号 本 中 断 请 求 yy 号 


外 围 设 备 A 外 围 设 备 B | 


. 图 11-7 ”中断 控制 怖 的 功能 


CPU 接收 到 来 目 中 断 控制 硕 的 中 断 请 求 后 ， 会 把 当前 正在 运行 的 
主 程序 中 断 ， 并 切换 到 中 断 处 理 程序 。 中 断 处 理 程序 的 第 一 步 处 理 ， 
就 是 把 CPU 所 有 寄存 硕 的 数值 保存 到 内 存 的 栈 中 。 在 中 岂 处 理 程序 中 
完成 外 围 设备 的 输入 输出 后 ， 把 栈 中 保存 的 数 信 还 原 到 CPU 寄存 带 
中 ， 然 后 再 继续 进行 对 主 程序 的 处 理 。 假 如 CPU 寄存 需 的 数值 没有 还 
(D BIOS (Basic Input Outpu System ) 位 于 计算 机 主板 或 扩张 板 卡 上 内 置 的 


ROM 中 ， 里 面 记 录 了 用 来 控制 外 转 设 备 的 程序 和 数据 。 这 一 点 在 第 7 章 中 
进行 过 说 明 。 
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原 的 话 ， 就 会 影响 到 主 程序 的 运行 ， 其 至 还 有 可 能 会 使 程序 意外 停止 
或 者 发 生 运行 异常 。 这 是 因为 主 程序 在 运行 过 程 中 ， 出 于 某 些 原因 用 
到 CPU 寄存 器 。 而 这 时 如 果 突 然 插 入 别 的 程序 ， 主 程序 必然 会 受到 影 
啊 。 因 此 ， 在 中 断 请 求 完 毕 后 ， 各 寄存 硕 的 数值 必 须要 还 原 到 中 断 前 
的 状态 。 只 要 寄存 右 的 值 保持 不 变 ， 主 程序 就 可 以 像 没 有 发 生 任 何事 
情 一 样 继续 处 理 ( 图 11-8 )。 


主 程序 


主 程序 的 处 理 | 
发 生 中 断 请 求 
i 、 中 断 处 理 程序 


外 围 设 备 控制 | 


主 程序 的 处 理 


、 图 11-8 ”中断 请 求 的 顺序 
11.5 ”用 中 断 来 实现 实时 处 理 


在 主 程序 运行 的 过 程 中 ， 中 断 发 生 的 频率 有 多 大 呢 ? 实际 上 ,大 
部 分 的 外 于 设备 ， 才 会 频 楷 地 发 出 中 断 请 求 。 其 原因 驶 是 为 了 实时 处 
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理 从 外 围 设备 输入 的 数据 。 虽 然 不 利用 中 断 也 可 以 从 外 围 设备 输入 数 
据 。 但 那 种 情况 下 ， 主 程序 就 必须 要 持续 不 断 地 检测 外 围 设备 是 否 有 
数据 输入 。 


由 于 外 于 设备 有 很 多 个 ， 因 此 就 有 必要 按照 顺序 来 调查 。 按 照 顺 
序 调 查 多 个 外 围 设备 的 状态 称 为 轮 询 。 对 几乎 不 产生 中 断 的 系统 来 说 ， 
轮 询 是 比较 合适 的 处 理 。 不 过 ， 对 计算 机 来 说 就 不 适合 了。 举例 来 说 ， 
假如 主 程序 正在 调查 是 否 有 鼠标 输入 ， 这 时 如 打发 生 了 键盘 输入 的 话 ， 
该 如 何 处 理 呢 ? 绪 采 势必 会 导致 键盘 输入 的 文字 无 法 实时 地 显示 在 显 
示 货 上 。 而 通过 使 用 中 断 ， 束 可 以 实现 实时 显示 了 。 


打印 机 等 输出 用 的 外 围 设 备 中 ， 外 围 设备 接收 数据 的 状态 ， 有 时 
是 需 要 用 中 断 来 通知 的 。 由 于 外 围 设备 的 处 理 速度 比 计算 机 主机 的 处 
理 速度 要 慢 很 多 ， 因 此 ， 这 种 情况 下 驶 不 需要 对 打印 机 的 状态 进行 多 
次 调查 ， 只 需 在 中 断 请 求 发 生 时 输出 数据 即 可 ， 这 样 一 来 ， 其 他 时 间 
CPU 就 可 以 集中 人 处 理 别 的 程序 了 。 中 断 人 处 理 是 不 是 很 方便 呢 。 


国 11.6 DMA 可 以 实现 短 时 间 内 传送 大 量 数据 
在 了 解 IO 输入 输出 及 中 断 处 理 的 同时 ， 还 希望 大 家 记 住 力 外 一 个 机 
制 ， 这 就 是 DMA ( Direct Memory Access )。DMA 是 指 在 不 通过 CPU 的 
情况 下 ， 外 围 设 备 直 接 和 主 内 存 进 行 数据 传送 。 磁 盘 等 都 用 到 了 这 个 DMA 
机 制 。 通 过 利用 DMA， 大 量 数 据 就 可 以 在 短 时 间 内 转送 到 主 内 存 。 之 所 以 
这 么 快速 ， 是 因为 CPU 作为 中 介 的 时 间 被 市 省 了 (图 11-9 )。 
图 11-10 和 在 前 面 看 到 的 软盘 控制 兹 的 属性 画面 是 相同 的 。 在 资源 


中 


@ 资源 是 计算 机 具备 的 有 限 资 源 的 统称 。 端 口号 、IRQ、DMA 等 可 以 指定 的 
数值 范围 都 是 有 限 的 ， 因 此 它们 也 是 资源 的 一 种 。 
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标签 中 有 DMA 设 定 ， 0 必定 为 02。02 这 个 编号 称 为 DMA 
通道 。CPU 借助 DMA 通道 ， 来 识别 是 哪 一 个 外 围 设备 使 用 了 DMA。 


进行 内 存 的 读 写 ( 速度 慢 ) 
-中 不 使 用 DMA 的 外 围 设备 的 MO 


使 用 DMA 的 外 围 设备 的 MO | 


直接 读 入 内 存 ( 速度 快 ) 


图 11-9 使 用 DMA 的 外 围 设备 和 不 使 用 DMA 的 外 围 设备 的 不 同 


< 专 标准 软盘 控制 器 


资 析 说 凌 (R): 

膏 源 类 型 。” 保 下 

王 IH 0Dxz0o000006 (OE) 
世 Dm D2 


设置 基于 二 ): ”| 当前 本 置 


回 司 用 自动 设置 
冲突 设备 列 志 : 
受 有 :5 


图 11-10 软盘 控制 器 的 DMA 通道 
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IO 端口 号 、IRQ、DMA 通道 可 以 说 是 识别 外 围 设备 的 3 点 组 合 。 
不 过 ，IRQ 和 DMA 通道 并 不 是 所 有 的 外 围 设备 都 必须 具备 的 。 计 算 机 
主机 通过 软件 控制 硬件 时 所 需要 的 信息 的 最 低 限 ， 是 外 围 设 备 的 VO 端 


口号 。IRQ 只 对 需要 中 断 处 理 的 外 围 设 备 来 说 是 必需 的 ，DMA 通道 则 
只 对 需要 DMA 机 制 的 外 围 设备 来 说 是 必需 的 。 假 如 多 个 外 围 设备 都 设 
定 成 同样 的 端口 号 、IRQ 及 DMA 通道 的 话 ， 计 算 机 就 无 法 正常 工作 
了 。 这 种 情况 下 ， 就 会 出 现 “ 设 备 冲突 ”的 提示 。 


转 11.7 文字 及 图 片 的 显示 机 制 

在 本 章 的 最 后 ， 让 我 们 一 起 来 看 一 下 显示 器 显示 文字 及 图 形 的 机 
制 。 如 果 用 一 句 话 来 简单 地 概括 该 机 制 ， 那 就 是 显示 需 中 显示 的 信息 
一 直 存 储 在 某 内 存 中 。 该 内 存 称 为 VRAM ( Video RAM )。 在 程序 中 ， 
只 要 往 VRAM 中 写 人 数据 ， 该 数据 就 会 在 显示 器 中 显示 出 来 。 实 现 该 
功能 的 程序 ， 是 由 操作 系统 或 BIOS 提供 ， 并 借助 中 断 来 进行 处 理 的 。 


在 MS-DOS 时 代 ， 对 大 部 分 计算 机 来 说 ，VRAM 都 是 主 内 存 的 一 
部 分 。 例 如 PC-9801 这 种 机 型 的 计算 机 ， 主 内 存 地 址 A0000 地 址 以 后 
是 VRAM 区 域 。 如 果 用 程序 往 VRAM 内 存 地 址 中 写 和 数据， 文字 及 
图 形 就 可 以 显示 出 来 。 不 过 ， 文 字 和 图 形 的 颜色 最 多 只 能 有 16 种。 这 
是 因为 VRAM 的 内 存 空 间 太 小 了 (图 11-11(a) )。 


在 现在 的 计算 机 中 ， 显 卡 等 专用 硬件 中 一 般 都 配置 有 与 主 内 存 相 
独立 的 VRAM 和 GPU (Graphics Processing Unit， 图 形 人 处理 侣 ， 也 称 
为 图 形 心 片 ) 这 是 因为 ， 对 经 帝 需 要 摘 绘 图 形 的 Windows 来 说 ， 数 百 
兆 的 VRAM 是 必需 的 。 而 为 了 提升 图 形 的 描绘 速度 ， 有 时 还 需要 专用 
的 图 形 处 理 带 (图 11-11(b) )。 但 不 管 怎样 ， 内 存 VRAM 中 存储 的 数据 
就 是 显示 带 上 显示 的 信息 ， 这 一 机 制 是 不 变 的 。 
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(a ) MS-DOS 时 代 


图 11-11 VRAM 中 写 入 的 数据 被 显示 在 显示 器 上 


用 软件 来 控制 便 件 听 起 来 好 像 很 难 ， 但 实际 上 只 是 利用 输入 输出 
和 令 同 外 围 设备 进行 输入 输出 的 处 理 而 已 。 中 断 处 理 是 根据 需要 来 使 
用 的 选项 功能 ，DMA 则 直接 交 给 对 应 的 外 围 设 备 即 可 。 由 此 可 见 ， 对 
程序 员 来 说 ， 其 实 并 不 困难 。 


虽然 计算 机 领域 的 新 技术 在 不 断 涌 现 ， 但 计算 机 能 处 理 的 事情 ， 
始终 只 是 对 输入 的 数据 进行 运算 ， 并 把 结 采 输出 ， 这 一 点 是 不 会 发 生 
任何 变化 的 。 不 管 程序 内 容 是 什么 ， 最 终 部 是 数据 的 输入 输出 和 运算 。 
本 半 介 绍 的 开启 和 集 止 蜂 鸣 此 的 程序 ， 就 是 一 个 很 好 的 例子 。 而 无 论 
是 计算 机 还 是 程序 ， 其 实 都 很 简单 。 


下 一 章 ， 我 们 会 通过 开发 一 个 简单 的 游戏 程序 ， 来 对 计算 机 的 “ 思 
考 ” 机 制 进行 说 明 。 
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如 果 是 你 ， 
你 会 怎样 介绍 ? 


邻 牛 老奶奶 说 明显 
和 电视 机 的 不 同 
笔者 : 老奶奶 您 好 啊 。 身 体 咋 样 啊 ? 
老奶奶 : 咽 咽 。 挺 好。 


笔者 : 顺便 问 一 下 ， 您 吝 
的 电视 三 目 呀 ? 

老奶奶 :《 水 户 黄 门 》 和 《其 坊 将 
军 》。 年 轻 人 看 的 电视 节目 太 吵 
J 了 > 学 不 了 

笔者 : 原来 您 喜欢 古装 剧 啊 。 我 也 
挺 喜 欢 的 。 不 认识 这 把 上 方 宝剑 
《水 成 届 1 大 了 省 于 长 
什么 样 了 么 ?”( 骏 坊 将 车 )， 
台词 还 真是 经 典 啊 。 
老奶奶 : 啊呀 啊呀 ， 小 年 轻 的 ， 这 
也 知道 ， 不 多 见 啊 。 做 什么 的 啊 ? 
笔者 : 计算 机 相关 的 工作 。 
老奶奶 : 计算 机 工作 ， 每 天 对 着 电 
视 机 。 眼 睛 很 素 吧 。 

笔者 : 您 知道 的 真 多 。 不 过 ， 计 算 
机 带 的 那个 画面 ， 和 电视 机 可 不 
一 样 ， 是 放 不 了 证 闭 剧 的 。 
老奶奶 : 是 吗 ? 那 计算 机 的 电视 机 


次 什么 样 


这 些 


2 
下 二 证 


放 的 是 什么 呢 ? 

笔者 : 这 个 不 是 电视 机 ， 大 家 称 它 
为 显示 器 。 电 视 机 最 初 是 “把 远 
处 的 东西 放映 出 来 ”的 意思 。 把 
电视 台 上 播放 的 古装 剧 ， 在 您 家 
里 放映 出 来 ， 就 是 电视 机 。 与 此 
相对 ， 计 算 机 显示 器 上 显示 的 是 
计算 机 主机 上 的 程序 的 运行 结果 。 
老奶奶 : 都 是 啥 跟 啥 啊 ， 太 难 了 ， 
不 懂 。 

笔者 : 抱 菊 啊 ， 老 奶奶 。 我 说 的 有 
点 难 理解 了 。 那 咱们 就 先 说 说 计 
算 机 的 功能 吧 。 计 算 机 有 好 多 功 
能 ， 公 司 、 事 务 所 等 处 理 文档 啊 
记 账 喻 的 ， 用 的 都 是 计算 机 。 
老奶奶 : ? ? ? 

笔者 : 这 么 说 可 能 有 点 失礼 ， 在 老 
奶奶 你 们 那个 年 代 ， 大 家 用 的 都 
是 纸 质 的 文档 和 记 账 本 等 。 现 在 ， 
计算 机 发 达 了 ， 大 家 就 不 再 用 纸 ， 
而 是 用 计算 机 来 处 理事 务 了 。 


J 
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老奶奶 :? ? ? 

笔者 :( 粳 了 ， 老 奶奶 不 说 话 了 ， 
有 办 法 了 ! ) 老奶奶 ， 计 算 机 的 显 
示 需 可 以 显示 文档 和 记 账 本 。 大 
家 就 是 看 者 这 些 来 进行 工作 的 。 
老奶奶 : 响 ， 有 点 明日 了。 那么 ， 
怎么 在 电视 机 中 的 文档 和 记 账 本 
上 上 写 学 呢 ? 

笔者 :( 有 戏 ， 老 奶奶 开口 了 ) 用 
键盘 啊 。 在 键盘 上 ， 有 大 量 标 着 
字母 和 数字 的 按键 。 只 要 按 下 这 
些 按 键 ， 就 可 以 写 了 。 计 算 机 是 
显示 需 、 键 盘 以 及 计算 机 主机 的 
组 合体 。 

老奶奶 : 这 么 说 来 计算 机 是 用 来 写 
字 的 工具 啊 。 还 真是 头 一 回 听 说 。 
笔者 : 额 …… 这 样 理 解 也 没有 
问题 。 

老奶奶 : 计算 机 的 电视 机 会 显示 
文学 。 

笔者 : (不 是 电视 机 ， 是 显示 带好 
不 好 ! ) 是 啊 ， 是 啊 。 

老奶奶 : 如 末 计 算 机 的 电视 机 能 放 
古装 剧 的 话 就 好 了 。 那 样 的 话 工 
作 的 时 候 还 能 看 电视 呢 。 

笔者 : 老奶奶 ， 这 还 真是 个 好 想 
法 ! 实际 上 ,利用 电视 调谐 如 ， 


就 可 以 在 计算 机 上 看 电视 了 。 
老奶奶 : 啊 ， 那 不 还 是 和 电视 机 一 
样 吗 ? 

笔者 : 额 …… 这 么 想 好 像 也 没有 什 
么 不 对 的 。 
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3 热身 问答 F 


阅读 正文 前 ， 让 我 们 先 回 丛 下 面 的 问题 来 热 热身 吧 。 


. 用 计算 机 进行 的 模拟 试验 称 为 什么 ? 
. 伪 随 机 数 指 的 是 什么 ? 

. 随机 数 的 种 子 指 的 什么 ? 

. 计算 机 有 思考 功能 吗 ? 

. 计算 机 有 记忆 功能 吗 ? 

. Al 是 什么 的 缩写 ? 


OO OO 人 WO ND 一 
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怎么 样 ? 是 不 是 发 现 有 一 些 问题 无 法 简单 地 解释 清楚 呢 ? 下 面 


是 笔者 的 答案 和 解析 ， 供 大 家 参考 。 


Om ow DN 


. 计算 机 模拟 

. 通过 公式 产生 的 伪 随 机 数 

. 生成 伪 随 机 数 的 公式 中 使 用 的 参数 
没有 

有 


-Artificial Intelligence 


.计算 机 模拟 是 指 用 软件 来 进行 实际 试验 。 

. 伪 随 机 数 同 真正 的 随机 数 不 同 ， 具 有 周期 性 。 
.随机 数 的 种 子 不 同 ， 产 生 的 随机 数 也 是 不 同 的 。 
.作为 计算 机 大 脑 的 CPU， 其 本 身 并 不 具有 思考 功能 。 
.内存 及 磁盘 等 有 记忆 功能 。 


.Artificial Intelligence 是 “人 工 智 能 ”的 意思 。 
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本 章 中 ， 我 们 将 用 C 语言 开发 一 个 简单 的 游戏 程 
序 ， 来 对 如 何 让 计算 机 “思考 ”进行 说 明 。 该 游戏 程序 
的 名 称 是 《猜拳 游戏 也 就 是 说 ， 让 大 家 和 计算 机 进行 猜 源 比试 。 在 
比试 开始 前 ， 是 先 出 石头 、 勇 刀 还 是 布 呢 ， 想 必 大 家 都 会 思考 一 番 。 
而 计算 机 也 是 如 此 ， 不 进行 “思考 ”就 无 法 获胜 。 那 么 ， 如 何 才 能 让 
计算 机 “思考 ” 呢 ? 我 们 可 以 用 程序 来 实现 思考 步 又， 然后 再 传 给 计 
算 机 。 大 家 知道 ， 即 使 是 对 同一 件 事情 ， 成 人 和 小 孩 的 思考 方式 也 是 
不 同 的 ， 经 验 、 直 觉 等 都 会 影响 “思考 ”的 深度 。 而 这 些 在 程序 中 是 
如 何 表示 的 呢 ? 这 就 是 本 章 的 重点 。 不 过 大 家 先 不 要 着 急 ， 让 我 们 从 
编程 开始 说 起 。 


12.1 ”作为 “工具 ”的 程序 和 为 了 “思考 ”的 程序 

程序 就 如 同 是 由 计算 机 执行 的 各 种 指令 罗列 起 来 的 文章 。 计 算 机 
内 部 的 CPU， 通 过 对 该 文章 的 内 容 进行 解析 和 运行 ， 来 控制 连接 到 计 
算 机 的 各 种 外 围 设备 。 具 体 来 说 ， 控 制 就 是 指 CPU 和 各 种 设备 之 间 配 
合 进行 数据 的 输入 输出 处 理 。 关 于 程序 的 运行 原理 ， 在 前 面 革 市 中 我 
们 已 经 从 各 方面 进行 了 说 明 。 那 么 ， 如 果 此 时 再 问 大 家 “使 用 程序 的 目 
的 是 什么 ”， 各 位 会 如 何 回答 呢 ? 

程序 的 使 用 目的 大 体 可 以 划分 为 两 类 。 一 类 是 大 家 作为 工具 来 使 
用 的 程序 。 例 如 ， 文 字 处 理 器 这 个 程序 ， 大 家 是 将 其 作为 文档 处 理 的 
工具 来 使 用 的 。 虽 然 用 笔 及 尺子 等 也 可 以 作成 文档 ， 不 过 用 文字 处 理 
器 会 更 有 效率 。 这 种 情况 可 以 说 是 程序 替代 了 现 有 的 工具 。 


为 外 一 个 使 用 目的 是 用 程序 来 代替 执 行人 类 的 思考 过 程 。 例 如 ， 
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微 计算 机 “控制 的 电饭煲 ， 会 根据 米 和 水 的 份量 来 自动 调整 火 的 大 小 以 
及 加 热 时 间 ， 进 而 烂 出 好 吃 的 米饭 。 当 然 ， 大 家 只 要 控制 好 火 的 大 小 
及 加 热 时 间 ， 也 可 以 做 出 好 吃 的 米饭 。 不 过 ， 这 件 事 由 计算 机 代替 执 
行 了 。 这 种 情况 就 可 以 说 是 借助 程序 ， 使 计算 机 有 了 “思考 ”功能 
(图 12-1 )。 


et 调整 火 的 大 小 
Cu 有 以 及 加 热 时 间 


、 图 12-1 电饭煲 中 内 置 的 微 计算 机 代替 执行 了 人 类 的 思考 过 程 


国 12.2 用 程序 来 表示 人 类 的 思考 方式 

那么 ， 如 何 才 能 让 计算 机 思考 呢 ?” 接 下 来 ,我 们 就 一 边 用 C 语言 
制作 《猜拳 游戏 》， 一 边 来 尝试 各 种 思考 方式 。 在 猜拳 游戏 中 ， 程 序 需 
要 让 计算 机 像 猜 拳 选手 一 样 来 思考 。 因 此 ， 为 了 制作 该 游戏 ， 就 需要 
“用 程序 来 实现 猜 将 选手 的 思考 步骤 "。 请 大 家 冷静 地 回忆 一 下 有 目 己 在 
猜拳 时 的 思考 过 程 。 如 果 这 个 思考 过 程 能 直接 用 程序 来 表现 的 话 ， 那 
么 就 能 实现 让 计算 机 思考 了 (图 12-2 )。 


大 家 通 稼 是 一 边 说 “石头 筋 刀 布 ”一 边 猜 黎 。 不 过 ， 小 孩子 的 话 ， 
在 次 “石头 勇 刀 ”的 时 候 ， 他 并 不 会 思考 接 下 来 是 出 石头 、 勇 刀 还 旦 


中 微 计算 机 是 微型 计算 机 的 简称 。 通 常 是 指 专门 用 来 控制 家 电 等 的 小 型 计算 机 。 
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布 ， 而 是 在 说 “ 布 ” 的 同时 直接 决定 。 这 就 是 一 种 没有 任何 宁 略 的 随意 
的 思考 方式 。 该 思考 过 程 用 程序 来 表示 的 话 ， 就 如 代码 清单 12-1 所 示 。 


青 产 时 的 思考 过 程 
… 时 出 石头 
… 时 出 剪刀 


Else | 上 …: 
Else:… 


图 12-2 用 程序 来 


代码 清单 12-1 ”随意 决定 出 拳 的 猜拳 游戏 程序 示例 


:enhblel -Ae bionNeb 
HN ee 


veldomain( el 
// 用 来 保存 计算 机 出 拳 信息 的 变量 


haeeeomoulee 


// 等 待 用 户 键盘 输入 
printf (" 石头 剪刀 ……: 
GSEEAEEL) 5 

Brintf ("al Nn) 


// 计算 机 决定 出 拳 
srand (time (NULL)).; 
computer = rand() % 3; 


// 输出 计算 机 的 出 拳 信息 
heompu ee m0, 
printf ("计算 机 的 出 拳 是 . 石头 \n")， 


} else if( computer == ) 
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二 
} else { 
Beineeo lr nr 


} 
} 


接 下 来 让 我 们 对 代码 清单 12-1 的 内 容 进行 说 明 。computer 是 用 来 
保存 计算 机 出 拳 数据 的 变量 。 石 状 、 剪 刀 、 布 分 别 用 数值 0、1、2 来 
表示 ( 后 面 的 程序 中 也 是 如 此 )。 这 里 使 用 随机 数 ” 来 决定 是 0、1、2 中 
的 某 一 个 数值 。 随 机 数 指 的 是 随机 出 现 的 没有 规律 的 数值 。 在 C 语言 
中 ，rand() 函数 返回 的 随机 数 的 范围 是 0 一 32767。 该 值 用 3 来 取 余 ， 
得 到 0、1、2 中 的 某 一 个 数值 。 用 该 值 作为 计算 机 的 出 拳 数据 。 也 就 
是 computer = rand() % 3; 这 一 部 分 。 其 中 ，% 是 取 余 运算 从。 而 至 于 
rand() 前 面 的 srand(time(NULL)); 的 功能 ， 我 们 会 在 后 面 进行 说 明 。 


该 程序 运行 后 ， 首 先 出 现 的 是 “ 石 涉 剪 刀 ……”。 这 个 时 候 请 大 家 
在 头脑 中 想 定 一 个 目 己 要 出 的 送 。 想 好 目 己 要 出 的 将 后 ， 按 下 Enter 
键 。 等 到 画面 中 出 现 了 “ 布 !1”"， 计 算 机 的 出 拳 信息 也 就 显示 出 来 了 。 
if...else 证 else 这 一 部 分 表示 的 是 ， 根 据 变量 computer 中 所 代入 的 数值 
(0、1、2 ) 的 不 同 ,计算 机 的 出 拳 信息 分 别 以 “ 石 潜 ” “藤丸 ”“ 布 ”的 
形式 显示 在 画面 上 。 程 序 的 运行 结果 如 图 12-3 所 示 。 


用 随机 数 决 定 出 拳 的 方式 ， 同 随意 而 定 的 思考 方式 是 相同 的 。 表 
12-1 是 该 程序 运行 10 次 时 计算 机 的 出 拳 信息 。 


(DD 通常 所 说 的 随机 数 指 的 是 统一 随机 数 。 统 一 随机 数 指 的 是 在 一 定数 值 范 转 
内 各 数 出 现 频率 相同 的 随机 数 形式 。C 语言 中 的 rand() 函数 的 返回 值 就 是 
统一 随机 数 。 


@ 图 灵 社 区 会 员 SMGliuhengting 专 享 尊重 版 权 


本 人 = 
国 命令 提示 符 


CGC:\Yazawa\Samples>Jankenl|. exe 
石头 藤 刀 


布 | 
计算 机 的 出 拳 是 ， 剪刀 


图 12-3 代码 清单 12-1 的 运行 结果 


表 12-1 代码 清单 12-1 的 运行 结果 和 计算 机 的 出 拳 信息 
次 数 1 2 3 4 5 6 7 8 9 10 
出 拳 信息 | 剪刀 石头 布 布 剪刀 剪刀 布 石头 石头 剪刀 


国 12.3 用 程序 来 表示 人 类 的 思考 习惯 

即使 是 成 年 人 ， 可 能 偶尔 也 会 像 代码 清单 12-1 这 样 猜拳 时 随 芝 决 
定 出 什么 。 不 过 ， 并 不 是 所 有 人 都 如 此 。 例 如 , “小 A 同学 喜欢 出 石 
头 ”， 像 这 样 ， 出 产 习 惯 是 因 人 而 异 的 。 习 惯 也 是 人 类 的 思考 方式 。 而 
如 采 要 用 程序 来 表示 人 类 的 习惯 ， 驶 需要 对 习惯 进行 定量 表现 。 虽 然 
这 里 提 到 了 定量， 但 大 家 不 要 想 得 太 复杂 。 出 石头 的 概率 是 50%， 出 
剪刀 的 概率 是 30%， 出 布 的 概率 是 20%， 像 这 样 用 数值 来 表示 的 方式 ， 


网 是 定量 的 意思 。 


下 面 就 让 我 们 来 生成 一 个 具有 习惯 的 程序 。 在 代码 清单 12-1 中 ， 
我 们 使 用 了 0、1、2 这 3 个 随机 数 来 表示 石 凑 、 筋 刀 、 布 。 这 里 ， 我 
们 用 0 一 9 这 10 个 随机 数 ，0 一 4 时 表示 石头 ，5 一 7 表示 剪刀 ，8 一 9 表 
示 布 ， 这 样 规定 后 ， 石 头 、 剪 刀 、 布 的 百分比 率 就 分 别 变 成 了 50%、 
30% 、20%。 


该 程序 只 要 把 先前 的 程序 稍微 改造 一 下 即 可 实现 。 把 决定 计算 机 出 
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其 的 computer = rand() %3; 部 分 变 成 computer = rand() %10;，computer 
变量 就 可 以 得 到 0 一 9 的 随机 数 了 。 然 后 ， 再 将 if… else if… else 这 一 
部 分 改造 为 ， 变 量 computer 的 值 是 0 一 4 时 显示 “石头 ” 为 $ 一 7 时 显 

未“ 剪刀”、 为 8 一 9 时 显示 “ 布 "。 通 过 这 些 变化 ， 石 头 剪 刀 布 出 现 的 
所 率 就 分别 50%、30%、20% 了 (代码 清单 12-2 )。 


代码 清单 12-2 ”具有 习惯 的 猜拳 游戏 程序 示例 


:0 GE EGLGO. HS 
Hanaenl ll ml 


vora mainm( | 
// 用 来 保存 计算 机 出 拳 信息 的 变量 


int computer; 


// 等 待 用 户 键盘 输入 
B21nEf (" 石头 剪刀 Ts 1 ) ; 
getchar(); 

BELriEe ("7 Nn 


// 计算 机 决定 出 拳 
srand (time (NULL)); 
computer = rand() 当 10; 


// 输出 计算 机 的 出 拳 信息 

if (computer >= 0 && computer <= 4) { 
printf ("计算 机 的 出 拳 是 石头 \n")， 

else If (conputer > og comuter .<7) | 
printf ("计算 机 的 出 拳 是 ， 剪刀 \n")， 

} else { 
EE 二 

} 


这 样 ， 具 有 某 种 习惯 的 猜拳 游戏 就 完成 了 。 让 我 们 把 程序 运行 一 
下 看 看 ( 表 12-2)。 相 比 前 面 的 程序 ， 该 程序 的 出 拳 方 式 更 类 似 于 人 
类 的 习惯 。 多 次 猜 苦 后， 就 会 发 现 “ 这 个 计算 机 有 出 石头 的 习惯 ”。 不 
过 ， 真 正 的 计算 机 并 不 具有 习惯 。 这 里 只 是 运行 了 具有 的 习惯 的 程序 
La 
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表 12-2 代码 清单 12-2 的 运行 结果 和 计算 机 的 出 拳 信息 
次 数 1 2 3 4 5 6 7 8 9 10 
石头 剪刀 剪刀 石头 石头 石头 剪刀 石头 布 石头 


转 12.4 程序 生成 随机 数 的 方法 

接 下 来 ， 让 我 们 看 一 下 随机 数 在 程序 中 扮演 的 角色 。 在 编写 游戏 
程序 时 ， 以 及 在 计算 机 模拟 ”等 情况 下 ， 经 常 使 用 随机 数 。 随 机 数 也 是 
用 程序 来 表示 人 类 的 直觉 及 念头 的 一 种 方法 。 从 代码 清单 12-2 的 运行 
结果 中 大 家 可 以 发 现 ,“ 一 直 在 出 石头 的 时 候 突 然 出 了 一 个 剪刀 ”， 这 
确实 很 像 人 类 的 行为 方式 。 


随机 数 色 子 ”是 用 来 产生 随机 数 的 一 种 工具 ， 每 个 色 子 有 20 面 。 
晃动 随机 数 色 子 后 ， 出 现在 正面 的 数字 就 是 随机 数 。 由 于 计算 机 没 法 
晃动 随机 数 色 子 ， 因 此 程序 一 般 会 通过 生成 类 似 于 随机 数 的 数值 公式 
来 得 到 随机 数 。 在 C 语言 中 ， 虽 然 该 公式 的 实体 是 隐藏 的 ， 但 只 要 调 
用 rand0 函数 ， 就 可 以 得 到 结果 ( 随机 数 )。 不过， 由 于 借助 公式 产生 
的 随机 数 具 有 一 定 的 规律 性 ， 因 此 并 不 是 真正 的 随机 数 ， 通 常 称 为 伪 
随机 数 。 不 过 ， 虽 然 是 伪 随 机 数 ， 仍 然 十 分 有 用 。 


作为 参考 ， 这 里 向 大 家 介绍 一 个 获取 伪 随 机 数 的 公式 。 该 公式 称 
为 线性 同 余 法 “。 如 果 把 Ri 作为 当前 随机 数 的 话 , 那么 下 一 个 出 现 的 随 


(D 计算 机 模拟 指 的 是 利用 计算 机 模拟 实际 试验 的 方式 。 经 常 被 用 于 建筑 物 的 
耐 震 实验 等 实际 难以 进行 的 实验 中 。 使 用 随机 数 的 计算 机 模拟 有 时 也 称 为 
“蒙特 卡 洛 法 ”， 来 源 于 因 赌 博 而 闻名 的 城市 一 一 蒙特 卡 洛 。 

@) 随机 数 色 子 的 各 面 上 都 标 有 1 一 20 (或 1 一 10 每 两 个 面 为 同一 个 数值 ) 的 数 
值 。 晃 动 随机 数 色 子 后 ， 就 可 以 得 到 1 一 20 (或 1 一 10 ) 的 一 个 随机 数 。 

@) 除了 线性 同 余 法 以 外 ， 还 有 其 他 获取 伪 随 机 数 的 方法 。 如 可 以 获得 更 接近 
“真实 随机 数 ” 的 “ 乘 同 余 法 ”“M 系 法 ”以 及 能 够 快速 生成 随机 数 的 
“Knuth 减 算法 ”等 。 
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机 数 R,,, 束 可 以 用 下 面 的 公式 来 获取 。 


R,,=(a x Ri+b)modc 


公式 中 出 现 的 mod， 是 整除 后 取 余 的 意思 。 同 C 语言 的 % 运算 符 
的 功能 是 一 样 的 。 对 a、b、c 各 参数 设 定 合适 的 整数 后 ， 可 以 从 该 公 
式 获 得 的 随机 数 的 范围 就 是 0 到 c (不 包含 )。 因 为 是 用 c 来 进行 取 余 ， 
所 以 得 到 这 个 范围 也 是 理所当然 的 。 我 们 不 妨 做 一 下 尝试 ， 把 4 设 定 
为 5, 5b 设 定 为 3,c 设 定 为 8， 获 得 的 随机 数 就 如 表 12-3 所 示 。 这 里 
把 Ri 的 初始 值 定 为 了 1。 可 以 看 出 ， 这 些 随 机 数 确实 很 像 是 无 规则 随 
机 出 现 的 数值 。 不 过 ， 产 生 8 次 随机 数 后 ， 下 8 次 产生 的 随机 数 就 和 
前 面 的 数值 相同 了 。 这 种 周期 性 是 伪 随 机 数 的 特征 ， 也 是 为 什么 不 是 
真 随机 数 的 原因 。 


C 语言 的 rund0 极 数 中 ， 也 肯定 通过 某 些 公式 生成 了 伪 随 机 数 。 假 
如 使 用 的 是 线性 同 余 法 的 话 ， 就 需要 提前 设 定 Ri、a、b、c 的 数值 ， 为 
此 就 要 用 到 代码 清单 12-1 及 代码 清单 12-2 中 的 srand(time(NULL));。 
srand() 国 数 中 的 参数 time(NULL)， 是 用 来 获取 当前 时 间 的 参数 。 以 
time(NULL) 的 值 为 基础 ， 来 设 定 Ri、a、b、c 的 数值 。 由 于 每 次 启动 
程序 时 的 当前 时 间 都 是 变化 的 ， 因 此 Ri、a、b、c 的 数值 也 会 随 之 发 生 
变化 。Ri、a、b、c 的 数值 就 称 为 随机 数 的 种 子 ， 这 一 点 大 家 要 有 个 印 
象 。 而 假如 在 不 运行 srand(time(NULD)); 的 情况 下 重复 调用 rand0 函数 
的 话 ， 会 出 现 什 么 情况 呢 ?” 因 为 Ri、a、b、c 的 数值 都 有 默认 值 ， 因 此 
每 次 都 会 生成 以 相同 方式 出 现 的 随机 数 。 这 样 一 来 ， 游 戏 以 及 计算 机 
模拟 就 都 无 法 成 立 了 。 当 然 也 就 无 法 表示 人 类 的 思考 了 。 
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表 12-3 用 线性 同 余 法 获得 的 随机 数 具 有 周期 性 


次 数 1 2 ed As | EGR [Se Fe og OW peti Pili rll Se eel ETSY Lali@ 
| A TO sd 0 6 区 


生成 了 以 相同 方式 出 现 的 随机 数 


国 12.5 活用 记忆 功能 以 达到 更 接近 人 类 的 判断 

i de 是 根据 直觉 和 经 验 做 出 的 。 直 党 并 不 仅仅 是 
简单 的 任意 思考 ， 通 稼 还 市 有 一 些 个 人 的 思维 习惯 。 在 前 面 的 介绍 中 
我 们 已 经 提 到 ， 通 过 借助 随机 数 ， 思 考 习 惯 等 也 是 可 以 表示 的 。 而 如 
果 在 此 基础 上 再 加 上 经 验 (记忆 ) 元 素 的 话 ， 想 必 就 可 以 作成 更 接近 人 
类 思考 的 程序 了 


请 大 家 考虑 一 下 猜拳 游戏 中 是 如 何 用 到 经 验 的 。 经 过 多 次 猜拳 后 ， 
我 们 可 能 就 会 得 到 类 似 于 “小 B 同学 在 出 石头 后 出 辫 刀 的 概率 比较 局 ” 
这 样 的 经 验 。 基 于 这 一 经 验 ， we 
同学 出 了 一 个 石 涉 ， 接 下 来 应 该 会 出 勇 刀 ， WA 
ye 在 该 程序 中 ， 通 过 键 
盘 输入 0、1、2 来 决定 出 养 。 当 键盘 输入 0、1、2 以 外 的 数值 时 ， 结 
束 游戏 。 
代码 清单 12-3 ”利用 经 验 来 决定 出 拳 的 猜拳 游 戏 程序 示例 


#include <stdio.h> 
Ht em el 


Tinai 
/对 手 的 吊 学 


int human; 


yA 代 放 对 王刚 WT 交大 


lm dev = 0 
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// 记忆 对 手 出 拳 信息 的 2 维 数组 
OO 


// 预测 的 对 手 出 拳 信息 


int max; 


// 猜拳 的 回合 数 


TIERRECOUTEEER EUOF 


// 计算 机 的 出 拳 


int computer; 


// 设 定 随机 数 的 种 子 
srand (time (NULL)).; 


// 重复 猜拳 
WO 
是 由 二 司 忌 


[On (0 EN 2 


Sree Sele na 
ae 


// 输入 0、1、2 以 外 的 数值 时 游戏 结束 


if numan =0 nman 2 ) Dreak 


// 记录 猜拳 的 回合 数 


Countert+t+; 


177 由 生 MV) 大 定 出 卒 信息 
TEUO(EoUnter e100 | 
// 低 于 10 次 时 ， 随 机 出 拳 


eonmueen am 


} else { 
// 高 于 10 次 时 ， 根 据 记 忆 来 出 拳 
IE Or 
if (memory [prev] [max] < memory [prev| [1]) max = 1; 
if (memory [prev] [max] < memory [prev] [2]) max = 2; 
computer = (max + 2) 当 3; 
} 
// 输出 计算 机 的 出 拳 信息 
Eee ET 三 一 
FREE (计算 机 的 出 养 是 有 站 "二 
} else if (computer == 1) { 
BPINneto( I 
} else { 
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Bent Eo | Sa 


} 


BmAmEE (TA?) 
// 记录 对 手 的 出 拳 信息 


memory [prev] [human] ++; 
Blew mam 


在 该 程序 中 ,猜拳 ee 而 对 手 
的 出 拳 信息 也 通过 2 维 数组 ”记录 了 下 来 。 例 如 player[0][0] 这 个 数组 元 
素 记 录 的 就 是 对 手 出 石头 后 再 出 石头 的 次 数 。 数 组 的 索引 0、1、2 分 别 
表示 石头、 剪刀 、 布 。 由 于 猜拳 洲 戏 刚 开始 时 ， 数 据 记 录 还 不 够 充 
足 ， 因 此 这 里 使 用 了 变量 counter 来 记录 猜拳 的 次 数 ， 当 不 满 10 次 
时 ， 由 随机 数 来 决定 出 拳 。 变 量 prev 记录 的 是 对 手 先前 的 出 拳 信息 。 


运行 代码 清单 12-3 的 程序 后 ， 就 会 发 现 计算 机 变 强 了 (图 12-4 )。 
表 12-4 表示 的 是 对 手 连续 出 了 15 次 石头 时 计算 机 的 出 拳 信息 。 借 助 记 
忆 功 能 ， 在 猜拳 游戏 进行 了 10 次 以 后 ， 计 算 机 出 的 都 是 布 ， 全 胜 。 
是 因为 计算 机 基于 “对 手 出 石头 后 还 会 出 石头 ”这 一 记忆 ， 做 出 
的 判断 。 


QD 有 两 个 索引 的 数组 称 为 2 维 数组 。2 维 数组 在 处 理 表格 形式 的 数据 时 很 便 
利 。 由 于 int player[3][3] 数组 前 后 的 索引 数值 分 别 是 0、1、2， 因 此 就 可 以 
用 类 似 于 下 面 这 种 3 行 Xx3 列 的 表格 形式 来 进行 数据 的 处 理 。 


再 次 出 拳 的 次 数 出 石头 的 次 数 出 剪刀 的 次 数 出 布 的 次 数 


前 一 回 出 石头 后 player[O0j][O] player[O][1] player[0][2] 
前 一 回 出 剪刀 后 player[1][0] player[1][1] player[1][2] 
前 一 回 出 布 后 player[2][0] blayerl2M i player[2][2] 
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到 命令 提示 符 - Janken3.exe 
C:\Yazawa\Samples>Jankeny. exe 
石头 剪刀 ( 0= 石 头 ，1= 剪 刀 ，2= 布 ， 其 他 = 退出 游戏 ) .… 


图 12-4 代码 清单 12-3 的 运行 结 


表 12-4 代码 清单 12-3 的 运行 结果 和 计算 机 的 出 拳 信息 


次 数 1 … 10 11 2 13 14 15 
出 拳 信息 ”剪刀 5 布 布 布 布 布 布 


单纯 就 记忆 能 力 来 说 ， 计 算 机 要 比 人 类 强大 得 多 。 因 此 ， 只 要 对 程序 
进行 一 些 改造 ， 使 计算 机 记 住 “对 手 出 石头 获胜 后 接 下 来 会 出 勇 刀 ， 出 石 
头 输 了 后 接 下 来 会 出 布 ” 这 些 细节 信息 的 话 ， 计 算 机 就 会 更 加 擅长 猜拳 
游戏 了 。 不 过 ， 如 琳 太 过 于 强大 的 话 ， 可 能 又 会 不 像 人 类 的 思考 方式 了 了 。 


国 12.6 用 程序 来 表示 人 类 的 思考 方式 

到 目前 为 止 ， 我 们 已 经 用 程序 表示 了 直觉、 想法、 习惯 以 及 经 验 
等 。 不 过 ， 除 此 之 外 ， 人 类 还 有 一 个 思考 方式 。 思 考 方式 是 思考 方法 
的 节 蔷 。 人 类 大 脑 中 有 类 似 于 “石头 、 石 凑 、 布 、 勇 刀 ” 或 “ 甬 刀 、 石 
头 、 石 头 、 布 ”这 种 具有 节奏 感 的 短语 ， 人 类 会 在 此 基础 上 做 出 判断 ， 
这 就 是 思考 方式 。 


代码 清单 12-4 是 用 程序 来 实现 思考 方式 的 示例 。 这 里 用 2 维 数组 
pttern[2][4] 来 表示 “石头 、 石 凑 、 布 、 勇 刀 ” 及 “ 衣 刀 、 石 凑 、 石 头 、 
布 ” 这 两 种 思考 方式 。 人 类 会 在 不 知 不 觉 中 按照 自己 的 思考 方式 出 拳 ， 
但 连续 输 掉 多 次 后 也 会 变换 一 些 方式 。 在 该 程序 中 ,我们 将 其 设 定 为 
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代码 清单 12-4 ”根据 思考 方式 来 决定 出 拳 的 猪 拳 游戏 程序 示例 


:0 GE <EGLO, ns 
:9 GS <AEG Lo, I 


veoid mainmn() | 


// 表示 思考 方式 的 2 维 数 组 


1 


// 连续 输 的 次 数 


ne lose = OF 


// 用 来 切换 思考 方式 的 变量 ( 0 和 1 之 间 切 换 ) 
me 1 = 0; 


// 根据 思考 方式 决定 出 拳 信息 


lame ms 05 


// 对 手 的 出 拳 


int human; 


// 计算 机 的 出 产 


int computer; 


// 设 定 随 机 数 的 种 子 
srand (time (NULLD) ) ; 


// 重复 猜拳 
oa 
// 对 手 决 定 出 拳 信息 


printf ("石头 剪刀 (0= 石头 ，1= 剪刀 ，2= 布 ， 其 他 = 退出 游戏 ) ... 


ScCanriE (vs numan) ; 
PETER 


// 输 入 0、1、2 以 外 的 数值 时 游戏 结束 


if(human < 0 || human > 2) break.; 


// 计算 机 决定 出 拳 信息 
computer = patternlpl] ln]; 
闻 二 (到 二 1L) 客气 


// 输出 计算 机 的 出 拳 信息 


Ee (eonmeoueer 0 
printf (ww 计算 机 的 出 拳 是 :有 有 头 nm) 
else if( comuter .= | 
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连续 得 两 次 驶 改变 思考 方式 。 在 时 顾 时 输 的 情况 下 ， 则 按照 节 委 以 同 
一 种 方式 出 拳 。 


Dremel 
} else { 
站 
声 天 二 而 世 全 人 AND) 7 
// 记录 计算 机 连续 输 拳 的 次 数 
if ((human == 0 && computer == 1) 
(human == 1 && computer == 2) 
(aumane 2 eon 
lose ++ ; 
} else { 
ose 0. 


} 


// 连续 输 拳 时 变换 思考 方式 
EE( ese ST 
B= (BT 1) S$ 28 
nl 0s 


运行 该 程序 后 ， 大 家 可 能 就 会 察觉 
在 至 今 为 止 我 们 所 介 


DW 
思考 方式 。 


大 家 应 该 都 听 过 人 工 智 能 (AI，Artificial Intelligence ) 这 个 术 


人 类 智 


语 。 人 工 智能 是 用 计算 机 来 实现 
的 1950 年 代 开 始 ， 关 于 人 工 智 
大 量 成 果 。 本 章 介绍 的 《猜拳 游戏 》》 虽 久 
可 以 说 是 人 工 智能 。 


不 过 ,计算 机 本 刁 并 不 智能 ， 它 只 是 运 


程序 而 已 。 也 就 是 说 ， 开 发 程序 的 程序 员 ， 赋 了 予 了 计算 机 这 些 智能 。 
行 了 重 现 。 想 到 这 


程序 只 是 将 人 类 的 想法 在 计算 机 上 进 
和 党 很 居 悦 呢 ? 
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到 “该 计算 机 有 上 自己 的 出 拳 方 
绍 的 程序 中 ， 该 示例 程序 可 能 最 接近 人 类 的 


能 的 答 
能 的 研究 驶 层出不穷 ， 
大 只 是 涉及 了 一 
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| 


试 。 从 计算 机 诞生 之 初 
到 现在 已 经 有 了 
碟 皮 所 但 也 


行 了 表现 人 类 思考 方式 的 


5 


广 些 ， 走 不 是 感 


机 
、...…， 如 果 是 你 ， 


你 会 怎样 介绍 ? 


( 


向 常 光临 的 酒馆 老板 讲解 计算 机 的 


思考 机 制 


小 老板 : 噢 ， 欢 迎 光 临 ! 怎么 看 起 
来 这 么 疲惫 呢 ? 

笔者 : 唉 ! 还 不 是 那个 策划 折腾 
的 ! 向 完全 不 了 解 计 算 机 的 女 高 
中 生 和 老奶奶 说 明 计算 机 的 机 制 ， 
真是 太 折 磨 人 了 。 

小 老板 : 还 真是 挺 折腾 的 呢 。 那 
么 ， 最 后 结果 咋 样 啊 ? 

笔者 : 差不多 明白 了 吧 。 差 不 多 。 
小 老板 : 历 害 啊 ! 不 过 实在 不 好 意 
思 ， 您 这 已 经 累 得 够 哈 了 ， 可 我 
也 有 个 问题 想 请 教 一 下 。 

笔者 : 啊 ， 你 可 侥 了 我 吧 。 

小 老板 : 可 别 这 么 说 。 来 来 ， 先 请 
你 喝 一 杯 。 

笔者 : 这 样 啊 ， 那 好 吧 ， 你 问 吧 。 
小 老板 : 计算 机 和 机 器 人 看 起 来 差 
不 多 吧 。 你 说 要 是 在 我 这 个 店 里 
面 也 放 一 合计 算 机 的 话 ， 是 不 是 
能 必 我 做 点 啥 呢 ? 


笔者 : 虽然 计算 机 也 可 以 和 机 带 人 
一 样 智能 地 使 用 ， 不 过 就 算 放 到 
你 店 里 也 不 能 立马 就 带 到 你 。 

小 老板 : 啊 ! 捅 不 全 ， 这 是 为 什 
么 呢 ? 用 简单 的 方式 给 我 解释 解 
释 吧 。 

笔者 : 将 来 的 计算 机 是 怎么 样 的 谁 
也 不 知道 啊 ， 不 过 现在 的 计算 机 
是 无 法 目 己 思考 的 。 假 如 要 让 计 
算 机 进行 思考 的 话 ， 就 必须 要 用 
程序 来 实现 思考 步骤 。 

小 老板 : 程序 这 个 东西 我 还 真 不 
懂 。 打 个 比方 说 ， 它 像 什 么 呢 ? 
笔者 : 这 个 程序 和 运动 会 及 首 乐 会 
等 的 程序 是 一 样 的 。 就 是 把 每 一 
步 做 什么 都 按照 顺序 写 下 来 的 文 
件 。 把 这 个 文件 用 和 英语 相似 的 
程序 语法 记述 下 来 ， 就 是 程序 。 
小 老板 : 那么 ， 具 有 思考 顺序 的 程 
序 ， 能 用 来 做 什么 呢 ? 
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笔者 : 额 …… 这 要 看 你 想 做 什么 
了 。 即 使 把 计算 机 放 在 你 店 里 ， 
如 果 你 不 清楚 用 它 来 做 什么 的 话 ， 
那 就 等 于 没 放 。 

小 老板 : 摆 上 计算 机 后 ， 它 不 能 帮 
我 做 点 什么 吗 ? 

笔者 : 嗯 ， 如 果 只 是 摆 上 一 台 计 算 
机 的 话 ， 还 真 帮 不 上 什么 忙 。 因 
为 计算 机 不 是 装饰 品 。 

小 老板 : 那 让 计算 机 和 店 里 的 客人 
聊天 ， 咋 样 ? 

笔者 : 好 ， 好 。 这 个 目的 的 话 也 是 
可 以 的 。 

小 老板 : 那 你 能 给 我 做 个 程序 吗 ? 
笔者 : 没 问题 ， 我 正好 带 着 笔记 本 
呢 ， 现 在 就 给 你 做 一 个 。 这 个 就 
算 你 请 我 喝酒 的 回 礼 了 ， 了 呵呵 。 
小 老板 : 在 这 就 可 以 啊 。 真 了 不 起 ! 
笔者 : 好 了 。 让 我 们 按 下 “对 话 ” 
按钮 看 一 下 。 

小 老板 : 就 是 这 个 么 ” “欢迎 光 
临 "” “您 喝 点 什么 ” “让 您 久 等 
了 ”“ 感 谢 您 的 光临 ”…… 就 这 些 
吗 ? 只 会 这 四 人 句 啊 ? 

笔者 : 那么 ， 你 想 要 什么 样 的 会 
话 呢 ? 

小 老板 : 叶 Se 


笔者 : 啊 ， 有 了 了 |! 
小 老板 : 小 点 声 ! 突然 这 么 大 声 吓 
我 一 跳 。 

笔者 : 你 刚才 是 不 是 在 思考 应 该 如 
何 进行 会 话 呢 ? 对 方 说 了 什么 之 
后 ， 目 己 驶 要 回答 点 什么 。 把 这 
个 顺序 整理 一 下 做 成 程序 的 话 ， 
网 可 以 让 计算 机 实现 和 人 类 一 样 
的 对 话 了 。 就 像 是 计算 机 目 己 进 
行 了 思考 一 样 。 

小 老板 : 啊 ， 这 样 啊 ， 明 日 了 ! 不 
过 ， 这 个 还 真 够 抹 烦 的 。 必 须要 
考虑 上 百 、 上 干 、 上 万 种 对 话 方 
式 才 行 啊 。 

笔者 : 是 啊 。 让 计算 机 进行 思考 ， 
确实 是 有 点 困难 。 
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本 书 涉及 的 程序 示例 ， 基 本 上 都 是 用 C 语言 编写 的 。 但 是 那些 完 
全 没有 编程 经 验 的 读者 以 及 刚 开始 学 习 编程 的 读者 ， 一 下 子 看 到 这 么 
多 的 C 语言 代码 ， 肯 定 会 感到 很 困惑 吧 。 考 虑 到 这 一 点 ， 我 们 特意 在 
本 书 的 最 后 增加 了 补充 音节， 来 对 C 语言 的 基本 语法 进行 说 明 。 


C 语言 是 AT&T 贝尔 实验 室 的 D. M. Ritchie 在 1973 年 推出 的 程序 
开发 语言 。C 语言 虽 是 高 级 编程 语言 ， 但 它 也 具备 了 能 够 和 汇编 霹 言 相 
媲美 的 低层 处 理 〈 内 存 操作 及 位 操作 ) 功能 。AT&T 贝尔 实验 室 开发 的 
Unix， 最 初 是 用 汇编 语言 编写 的 ， 但 后 来 大 部 分 都 用 C 语言 进行 了 重 
写 。 傅 助 C 语言 ，Unix 的 移植 性 得 到 了 大 幅 提 升 ， 进 而 使 得 更 多 类 型 
的 计算 机 开始 应 用 Unix 操作 系统 。 此 外 ， 作 为 Unix 系列 操作 系统 之 
一 的 Linux 也 是 用 C 语言 来 编写 的 。 


即使 在 现在 ，C 语言 也 依然 是 常用 的 编程 语言 。 我 们 知道 ， 信 息 处 
理 技 术 员 职称 考试 中 可 以 选择 的 编程 语言 有 汇编 语言 COBOL、C 语 
言 、Java， 从 这 一 点 就 可 以 看 出 C 语言 的 重要 性 。 同 时 这 也 表明 ， 在 
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当前 的 信息 处 理 中 ， 这 四 种 语言 是 最 党 使 用 的 。 


在 最 新 的 Web 编程 中 ，Java、C# 等 编程 语言 最 有 人 人 气 。Java 和 
C# 都 不 是 全 新 的 编程 语言 ， 而 是 在 对 C 语言 语法 进行 了 扩张 的 C++ 的 
基础 上 发 展 而 来 的 。 因 而 ， 上 只 要 掌握 了 C 语言 ， 也 就 能 很 快 营 握 Java 
及 C#。 另 外 ， 大 部 分 的 C 语言 编译 需 ， 都 具有 将 C 语言 源 代码 转换 成 
汇编 语言 源 代码 的 功能 ， 以 及 可 以 在 C 语 言 源 代码 中 航 入 汇编 语言 的 
特点 。 


变量 和 函数 

不 管 使 用 什么 样 的 编程 语言 ， 程 序 内 容 都 是 由 数据 和 处 理 构成 的 。 
至 于 程序 的 数据 和 处 理 具体 该 如 何 表示 ， 则 根据 编程 语言 的 不 同 而 不 
间 。 在 C 语言 中 ， 数 据 用 变量 来 表示 ， 处 理 用 函数 来 表示 。 因 而 ，C 
语言 的 程序 就 是 由 变量 和 函数 构成 的 ( 图 A-1 )。 


图 A-1 C 语 言 程序 是 由 变量 和 函数 构成 的 


看 到 变量 和 冰 数 这 些 术语 ， 大 家 佑 计 会 想到 数学 。 数 学 的 变量 通 
第 用 x、y、z 这 些 字 母 来 表示 。 数 学 的 函数 则 基本 上 部 是 像 f(x) 这 样 ， 
在 函数 名 (这 里 是 f) 后 面 加 上 括号 ， 并 在 其 中 指定 变量 (这 里 是 xy) 
C 语言 中 变量 和 哨 数 的 摘 述 方法 ， 同 数 竺 是 一 样 的 。 


不 过 ,在 C 语 言 中 ,我 们 要 从 程序 的 角度 来 理解 变量 和 函数 ， 而 
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不 能 从 数学 的 角度 来 理解 。 例 如 x、y、z 这 些 变量 ， 在 数学 中 是 “变化 
的 数值 ”的 意思 ， 但 在 程序 中 表示 的 则 是 “存放 数值 的 地 方 ”。f(x) 这 


个 函数 ， 在 数学 上 表示 的 是 “变量 x 这 个 参数 决定 了 区 数 的 结果 ”， 但 
从 程序 上 来 看 则 是 “用 f 函数 来 处 理 x 这 个 变量 ”的 意思 。 


在 数 等 中 ,y= f(t) 这 一 表现 形式 表示 的 是 “y 是 x 的 孙 数 ”的 意思 ， 
但 在 程序 中 表示 的 则 是 “用 f 响 数 来 处 理 变 量 x， 并 将 处 理 结 末代 入 y”。 
数学 中 的 等 号 (= ) 表示 的 意思 是 “相等 "， 而 程序 中 的 等 号 表示 的 则 
是 赋值 的 意思 。 在 C 语言 中 表示 相等 时 ， 要 用 两 个 连续 的 等 号 。 


团 数据 类 型 

数学 变量 对 位 数 和 精度 是 没有 任何 限制 的 。 与 此 相对 ， 程 序 变量 
则 受 位 数 和 精度 的 限制 。 这 是 因为 ,计算 机 的 存储 容量 是 有 限 的 。 计 
算 机 中 预 完 被 定义 过 的 位 数 和 精度 称 为 数据 类 型 。C 语言 中 主要 的 数据 
类 型 如 表 A-1 所 示 。 其 中 ，Char、short 、int 是 整数 用 的 数据 类 型 。 
float 和 double 是 小 数 用 的 数据 类 型 。 


表 A-1 C 语言 中 主要 的 数据 类 型 


名 称 长 度 ( 位 长 ) 精度 ( 可 以 表示 的 10 进 制 数 ) 
char 8 一 128 ~ + 127 
short 16 760 7 
int ( 或 long) 2 D147 400 640 E217 A83647 
float 32 oA 
double 64 0 


在 程序 中 使 用 变量 ( 赋值、 运算、 显示 等 ) 时 ， 需 要 同时 对 数据 类 
型 和 变量 名 进行 定义 ， 如 代码 清单 A-1 所 示 。 在 C 语言 中 ， 每 个 指令 行 
的 末尾 部 要 用 分 号 (; ) 来 区 分 。// 后 面 是 注释 (对 程序 的 说 明 ), a= 123; 
部 分 表示 的 是 给 变量 a 代入 数值 123， 也 就 是 对 a 进行 赋值 。 在 这 部 分 
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之 前 ， 需 要 对 数据 类 型 和 变量 名 进行 定义 ， 这 里 使 用 了 int a;。 通 过 对 
变量 进行 定义 ， eden 型 长 度 所 需要 的 内 存 
空间 ， 并 使 用 变量 名 来 对 内 存 空间 进 


代码 清单 A-1 使 用 变量 前 


十 前世 本 5 /yy 十 六 1 < 生 


EE 
j 珊 
类 开 


a _ 123; // 为 变量 a 赋值 123 


团 标准 函数 库 

明 数 包括 程序 员 自 己 编写 的 图 数 以 及 系统 提供 的 困 数 。 其 中 ， 后 
者 通 稼 称 为 标准 函数 库 。 标 准 函 数 库 是 指 具 有 可 被 各 种 程序 使 用 的 通 
用 功能 的 函数 。 本 书 的 示例 程序 中 涉及 到 的 printf、scanf、rand 等 都 是 
标准 也 数 库 的 一 种 。 这 些 函 数 分 别 有 “ 输 出 到 显示 右上 显示 ”“ 从 键盘 
输入 信息 ”“ 产 生 随 机 数 ”等 通用 功能 。 


四 数 的 括号 中 ， 除 变量 以 外 ， 也 可 以 放置 通过 文字 串 、 数 值 等 指 
定 的 数据 信息 ， 这 些 统称 为 参数 。 被 作为 函数 的 处 理 绪 采 而 返回 的 数 
值 称 为 返回 值 。 利 用 也 数 称 为 函数 调用 。 根 据 孙 数 种 类 的 不 同 ， 也 有 
一 些 函 数 是 不 需要 参数 或 没有 返回 值 的 。 


把 函数 比喻 成 “工厂 ”的 话 可 能 更 好 理解 。 这 样 一 来 ， 参 数 就 是 被 
拉 入 工厂 的 “原材料 ”。 在 工厂 中 对 原材料 进行 加 工 后 ， 得 到 的 “产品 ” 
就 是 返回 值 (图 A-2 )。 


在 这 一 过 程 中 ， 计 算 机 的 基本 操作 大 体 可 以 划分 为 “输入 数据 ” 
“处 理 数据 ”“ 输 出 数据 ”三 块 。 如 果 是 一 个 简单 的 示例 程 序 的 话 ， 想 必 
应 该 会 通过 键盘 来 输入 数据 ， 并 将 处 理 绪 采 输出 到 显示 船上 。 因 而 ， 
如 果 编 写 出 来 的 程序 包含 了 从 键盘 输入 数据 、 对 数据 进行 相应 处 理 、 
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把 结 末 输 出 到 显示 大 上 这 一 系列 操作 的 话 ， 就 说 明 具 备 了 C 语言 基础 。 
如 代码 清单 A-2 所 示 。 该 示例 是 对 键盘 输入 的 两 个 数值 求 平 均值 ， 并 
把 结 采 输出 到 显示 融 上 。 这 里 ， 变 量 用 的 是 整数 数据 类 型 int, 平均 值 
如 果 有 小 数 部 分 的 话 就 将 小 数 部 分 售 痉 。 如 采 不 想 舍 弃 的 话 ， 将 变量 
的 数据 类 型 指定 为 float 或 double 即 可 。 


图 A-2 像 工厂 一 样 的 函数 


代码 清单 A-2 具备 输入 、 运 算 、 输 出 功能 的 程序 示例 


1m a@, DD, Aves; X77 让 309nEe 关 型 的 站 时 0DOoVe 

Sn ds 号 // 接收 从 键盘 输入 的 a 

ere ne // 接收 从 键盘 输入 的 b 

ave = (a + b) / 2; // 计算 a 和 Pb 的 平均 值 ， 并 将 结果 赋值 给 ave 
Belinee (nNm SO 二 // 把 ave 的 值 输出 到 显示 器 上 


函数 调用 
在 C 语 言 中 ， 是 不 能 像 代码 清单 A-2 那样 直接 记述 处 理 的 ， 而 是 
必须 将 这 一 系列 的 处 理 整 合 到 函数 中 。 而 “整合 到 水 数 中 ”， 就 是 程序 
员 目 己 来 记述 晒 数 的 意思 。 


大 规模 的 程序 是 由 大 量 函 数 构 成 的 ， 而 像 示 例 程序 这 种 简单 的 程 
序 ， 只 需要 一 个 水 数 就 可 以 实现 了 。 该 孔 数 的 名 称 就 是 main， 这 是 规 
定 。main 是 程序 启动 时 最 初 运行 的 水 数 。 在 由 多 个 也 数 构成 的 程序 中 ， 
程序 启动 时 运行 main 水 数 ， 并 在 main 也 数 中 调用 其 他 消 数 ， 然 后 该 
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图 数 又 调用 其 他 因数 ……， 像 这 样 ， 所 需要 的 羡 数 会 被 一 个 接 一 个 地 
调用 。 而 价 单 的 程序 中 则 仅仅 包含 了 最 初 执行 的 main 困 数 ， 因 此 ， 所 
有 的 处 理 都 会 集中 在 该 部 分 进行 。 


代码 清单 A-3 是 把 代码 清单 A-2 的 5 行 代码 都 整合 到 main 函数 中 时 
的 情况 。 函 数 的 处 理 内 容 是 用 f 围 起 来 的 部 分 。f 围 起 来 的 部 分 称 为 模 


块 。 模 块 (block ) 也 有 “整合 ”的 意思 。 这 里 ， 为 了 便于 大 家 理解 模块 
的 处 理 内 容 在 入 之 中 ， 编 写 时 特意 在 每 行 的 开头 空 出 了 一 些 位 置 。 运 行 
时 ， 按 照 代 码 记述 的 顺序 ， 各 个 处 理 就 会 被 从 上 往 下 依次 执行 。 


代码 清单 A-3 ”将 所 有 处 理 整合 到 main 函数 的 程序 示例 


#include <stdio.h> 


veda ma (yerg 


了 让 ， 有 各， QV; // 定义 3 个 int 类 型 的 变量 a、b、ave 

seanfe (noare es) // 接收 从 键盘 输入 的 a 

em or // 接收 从 键盘 输入 的 b 

ave (75 /> // 计算 a 和 的 平均 值 ， 并 将 结果 赋值 给 ave 
1 // 把 ave 的 值 输出 到 显示 器 上 


void main(void) 中 的 void 表示 的 是 该 main 函数 没有 参数 也 没有 返 
回 值 的 意思 。void 的 字面 意思 是 “ 空 的 "。 文 草 开 涉 的 #include ， 表 示 
的 是 参考 stdio.h 文件 的 意思 。include 的 字面 意思 是 “包含 "。 在 stdio.h 
文件 中 ， 定 义 了 标准 函数 库 printf 和 scanf。 该 文件 就 称 为 头 文 件 。 头 
文件 的 扩展 名 为 header 的 头 一 个 字母 “7 。 各 标准 库 函 数 用 到 的 头 文 
件 ， 都 是 同 编译 需 一 起 安装 的 。 


明 数 的 处 理 内 容 比较 短 ， 因 此 并 不 需要 多 个 函数 。 即 便 如 此 ， 
Nain 数 的 话 会 怎样 呢 ? 我 们 不 妨 来 看 一 下 。 
分 开 后 如 代码 清单 A-4 所 示 。 在 main 兄 数 中 ， 从 键盘 输入 两 个 数值 并 
分 别 赋 值 给 a 和 5， 然后 把 这 两 个 数值 作为 参数 传递 给 刚 做 成 的 
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average 图 数 ， 再 将 average 困 数 的 返回 值 赋值 给 变量 ave， 这 样 ave 的 


数值 就 被 输出 在 显示 带 上 了 。 由 此 可 见 ，average 函数 成 功 地 实现 了 求 
解 作 为 参数 的 两 个 数值 的 平均 值 并 把 结 采 返回 这 一 操作 。 这 是 因为 
main 国 数 调用 了 average 函数 。 


代码 清单 A-4 从 main 函数 中 调用 average 函数 的 程序 示例 


:GE <SEGLG, ns 


0 // 定义 average 函数 的 原型 

velg main( vo 
ee 7/ 十 X31 jnt 关 型 的 业主 a、 Dave 
Seame( oe // 接收 从 键盘 输入 的 a 
Seane( 2 // 接收 从 键盘 输入 的 b 
re veraagele 0 // 计算 a 和 hb 的 平均 值 ， 并 将 结果 赋值 给 ave 
和 // 把 ave 的 值 输出 到 显示 器 上 


nt averadgel( im or Tint Bl 


return (a + b) / 2; WV 写 20 的 中 二 | 得 作 2 撤回 | 但 运 加 


int average(int a, int b){…} 开头 的 int， 表 示 average 图 数 的 返回 值 
是 int 类 型 ， 括 写 中 的 int 表示 的 是 参数 a 和 b 是 int 类 型 。return 是 返 


回 丽 数 返 回 值 的 指令 。 这 里 返回 的 是 (a+b)/2， 也 就 是 a 和 的 平均 值 。 


请 大 家 注意 一 下 代码 清单 A-4 中 的 注释 “定义 average 图 数 的 原型 ” 
这 一 部 分 。 编 译 需 会 按照 从 上 到 下 的 顺序 解析 源 代 码 的 内 容 。 而 如 采 
main 曙 数 中 突然 出 现 average 困 数 的 话 ， 编 详 带 就 会 理解 为 “没有 该 郧 
数 "， 从 而 进行 报错 。 正 因为 如 此 ， 就 有 必要 在 代码 的 开头 部 分 加 上 int 
average(inbinb， 来 告诉 编 详 希 “在 后 面 有 一 个 名 是 average、 返 回 值 是 
int 类 型 、 两 个 参数 也 是 int 类 型 的 函数 "。 这 个 就 称 为 函数 原型 定义 。 


前 面 已 经 提 到 ，stdio.h 文件 中 定义 了 标准 也 数 库 中 的 printf 和 scanf 
子 数 。 具 体 来 说 ， 就 是 在 stdio.h 文件 中 定义 了 printf 和 scanf 的 原型 。 
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国 局 部 变量 和 全 局 变量 
在 冰 数 模块 中 定义 的 变量 ， 只 能 在 该 亢 数 中 使 用 。 这 样 的 变量 承 
称 为 局 部 变量 。 局 部 (local ) 是 地 区 的 ”的 意思 。 在 代码 清 
单 A-4 中 ，main 函数 中 定义 的 a、b、ave 都 是 局 部 变量 。 如 果 将 局 部 
ph 给 其 他 函数 来 处 理 的 话 ， 该 数值 就 会 被 作为 参数 来 使 
。 代码 清 单 A-4 就 是 把 main 函数 的 局 部 变量 w&、2 作为 参数 传递 给 
oe 负数 。 


变量 也 可 以 在 函数 模块 外 进行 定义 (虽然 函数 处 理 必须 要 在 子 数 的 
模块 中 进行 ,但 变量 是 可 以 在 模块 外 进行 定义 的 )， 该 变量 称 为 全 局 变 
en 全 体 的 ”意思 。 全 局 变量 在 程序 的 
所 有 号 数 中 都 可 利用 。 因 而 ,通过 利用 全 局 变量 ， 在 也 数 中 就 可 以 获 
取 其 他 函数 的 数值 。 hiner 
就 会 使 程序 内 容 变 复 柳 (无 法 清楚 掌握 是 哪些 函数 在 使 用 全 局 变量 )， 

一 点 一 定 要 注意 。 

将 代码 清单 A-4 的 程序 示例 改造 为 使 用 全 局 变量 的 形式 后 ， 结 采 
就 如 代码 清单 A-5 所 示 。 可 以 看 出 ，average 函数 的 参数 没有 了 。 而 
ave 还 是 局 部 变量 的 形式 。 这 是 因为 ave 仅仅 被 用 在 了 main 清 数 中 。 


代码 清单 A-5 ”利用 全 局 变量 的 程序 示例 


Hinalen lel emo 


ne ele // 定义 average 函数 的 原型 
I // 定义 全 局 变量 a、b 
wa eng | 
Te // 定义 局 部 变量 ave 
Scan 过 // 接收 从 键盘 输入 的 a 
Swiss 下 // 接收 从 键盘 输入 的 b 
人 // 计算 a 和 的 平均 值 ， 并 将 结果 赋值 给 ave 


printf("sdq\n"，ave); // 把 ave 的 值 输出 到 显示 器 上 
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int average (void) { 
return (a + b) / 2; // 把 两 个 参数 的 平均 值 作为 返回 值 返回 
} 


数组 和 循环 

处 理 大 量 数据 是 计算 机 擅长 的 领域 之 一 。 例 如 ， 在 求解 100 万 个 
数据 的 平均 值 的 时 ， 利 用 计算 机 瞬间 就 能 完成 。 在 程序 中 表现 大 量 数 
据 时 ， 通 常会 使 用 数组 的 形式 。 数 组 的 全 体 数 据 用 同一 个 名 字 (数组 的 名 
字 ) 来 表示 ， 各 数据 ( 称 为 元 素 ) 则 通过 从 0 开始 的 连续 编号 ( 称 为 索 
引 ) 来 进行 区 分 。100 万 个 数据 的 话 ， 输 入 起 来 太 过 麻烦 ， 因 此 ， 这 里 我 
们 就 来 做 一 个 求解 10 个 数据 的 平均 值 的 程序 ， 如 代码 清单 A-6 所 示 。 


代码 清单 A-6 求解 10 个 数据 的 平均 值 的 程序 示例 


#include <stdio.h> 


veleamainm(yvoigd nl 
1mte Oatalldl; // 定义 有 具有 10 个 元 素 的 数组 data， 数 据 类 型 为 int 
Me vn ave 7 77 定义 3 个 iC 大 型 的 记 宇 SUM doe 


sum = 0; // 把 用 来 保存 总 和 结果 的 sum 清 0 
// 将 i 从 0 ~ 9 了 逐一 + 1， 递 增 循 环 
For (T= 0 1 < 100 JTree) od 


scanf ("mn%d",，&datal[i]); /把 从 键盘 和 输 六 的 数值 存 六 aatarl 中 
sum += aqQata[il ， a Jl 


} 


ave = sum / 10;  // 用 sum 除 以 10 得 到 平均 值 
printf("%d\n"，ave);  ”// 将 ave 的 值 输出 到 显示 器 上 


int data[10]; 部 分 是 数组 的 定义 。 表 示 的 是 “请 准备 好 数据 类 型 是 
int、 有 10 个 元 素 、 数 组 名 为 data 的 数组 ”。 定 义 数组 后 ，data[0]、 
data[1]、data[2]、data[3]、data[4]、data[3]、data[6]、datal7]、datal8]、 
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data[9] 这 10 个 元 素 驳 可 以 使 用 了 。 虽 然 数组 是 市 方 括号 的 表现 形式 ， 
但 数组 各 元 素 的 利用 和 通常 的 变量 是 没有 区 别 的 。 


从 键盘 重复 输入 10 个 数值 ， 并 分 别 赋值 给 data[0] 一 data[9]。 输 入 
的 数值 与 变量 sum 连续 相 加 10 次 后 ， 即 可 得 到 data[0]~~data[9] 的 总 
和 。 将 sum 的 数值 除 以 10 后 得 到 的 平均 值 代入 ave 中 ， 并 把 结果 输出 
到 显示 规 上 。 


连续 10 次 的 重复 处 理 ， 用 for(int i=0; i<10;i+t+){…} 来 表示 。for 括 
号 中 的 内 容 被 分 号 分 割 成 了 3 部 分 ， 按照 顺序 分 别 是 “循环 刚 开始 时 只 
执行 一 次 ”“ 循 环 继续 的 条 件 " “每 次 循环 处 理 后 执行 的 处 理 ”。 在 处 理 
数组 的 情况 下 ，for 括号 中 一 般 以 表示 数组 索引 的 变量 ( 在 这 里 是 i) 从 
0 开始 逐一 增加 的 形式 来 指定 元 素 。i 变量 称 为 循环 计数 器 。 循 环 
(loop ) 是 “重复 ”的 意思 。 因 此 ，for(int i=0;i<10;it+) 表示 的 就 是 “ 循 
环 刚 开始 时 将 i 的 值 设 定 为 0”“ 在 i<10 的 条 件 下 继续 循环 “每 次 循环 
处 理 完毕 后 i 的 数值 +1”"。 这 样 ,i 的 数值 就 是 从 0 一 9 逐一 递增 ，for 
模块 ( {} 围 起 来 的 部 分 ) 中 的 处 理 也 被 重复 10 次 。 


这 里 请 大 家 注意 一 下 for 模块 中 的 data[i]。 它 表示 的 是 数组 data 的 
第 i 元 素 的 意思 。 由 于 i 的 值 是 从 0 一 9 依次 递增 的 ， 因 此 ， 数 组 各 元 
系 data[0]~~data[9] 的 处 理 (这 里 指 从 键盘 输入 、sum 求 和 ) 就 可 以 按照 
顺序 进行 了 。 


团 其 他 语法 结构 

C 语言 的 语法 结构 是 ANSI ( American National Standard Institute， 
美国 国家 标准 协会 ) 制定 的 。ANSI 规定 了 如 表 A-2 所 示 的 32 个 C 语 
言 的 关键 词 。 如 有 果 能 够 完全 理解 这 些 关 键 词 的 具体 意思 和 用 途 的 话 ， 


那 就 说 明 你 已 经 掌握 了 C 语言 的 语法 结构 。 在 补充 章节 中 ， 已 经 涉及 
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到 了 不 少 关键 词 。 因 此 ， 大 家 只 需 查 一 下 没有 涉及 的 关键 词 有 多 少 ， 


束 能 知道 月 己 还 需 多 入 才能 完全 车 握 C 语 言 了 。 


表 A-2 C 语言 的 关键 字 ( 按 英 文字 母 排序 ) 


auto 声明 自动 变量 
break 跳出 当前 循环 
case 开关 语句 分 文 
char 声明 字符 型 变量 或 函数 
const 声明 只 读 变 量 
continue 结束 当前 循环 ， 开 始 下 一 轮 循环 
default 开关 语句 中 的 ”其 它 ” 分 支 
do 循环 语句 的 循环 体 
double 声明 双 精 度 变 量 或 函数 
else 条 件 语句 否定 分 支 (与 if 连用 ) 
enum 声明 枚 举 类 型 
extern 声明 变量 是 在 其 它 文 件 中 声明 
float 声明 浮 点 型 变量 或 函数 
for 一 种 循环 语句 
goto 无 条 件 跳 转 语句 
if 条 件 语句 
int 声明 整 型 变量 或 函数 
long 声明 长 整 型 变量 或 函数 
register 声明 寄存 器 变量 
return 子 程序 返回 语句 ( 可 以 带 参 数 ， 也 可 不 带 参数 ) 循环 条 件 
short 声明 短 整 型 变量 或 函数 
signed 声明 有 符号 类 型 变量 或 函数 
Sizeof 计算 数据 类 型 长 度 
static 声明 静态 变量 
struct 声明 结构 体 变 量 或 函数 
switch 必定 证 天 虽 司 
typedef 用 以 给 数据 类 型 取 别 名 
union 声明 共用 数据 类 型 
unsigned 声明 无 符号 类 型 变量 或 函数 
void 声明 函数 无 返回 值 或 无 参数 ， 声 明 无 类 型 指针 
volatile 说 明 变 量 在 程序 执行 中 可 被 隐 含 地 改变 
while 循环 语句 的 循环 条 件 
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最 后 讲 一 下 学 习 C 语言 的 技巧 。 不 仅仅 是 C 语言 ， 学 习 所 有 编程 
语言 的 语法 结构 ， 都 不 应 该 是 罗 轿 厨 训 地 育 下 来 。 只 有 多 做 上 机 练习 
并 反复 确认 运行 结果 ,才能 征服 这 门 培 言 。 因 此 ， 我 并 不 希望 大 家 仅 
仪 记 住 语法 结构 ， 而 是 要 掌握 该 语法 的 具体 使 用 方法 。“ 了 解 语法 结构 
但 不 会 编写 程序 ”和 “知道 天 文 语法 却 不 会 说 瑞 语 ”是 同样 的 。 不 管 是 
C 语言 还 是 英语 ， 都 是 从 实践 中 得 来 的 。 在 C 语言 的 语法 结构 中 ,很 
多 人 都 提 到 指针 和 结构 比较 难 。 而 如 果 想 要 和 营 握 指针 和 结构 的 话 ， 那 
你 驶 要 去 查看 一 下 它们 是 如 何 使 用 的 ， 并 通过 编写 各 种 程序 来 反复 进 
行 尝试 。 

在 学 习 的 初始 阶段 ， 大 家 下 接 模 仿 教 材 中 的 示例 程序 即 可 。 慢 慢 
的 ， 你 就 会 想 对 示例 程序 进行 改造 。 再 到 后 来 ， 你 就 会 尝试 把 几 个 示 
例 程 序 组 合 起 来 做 成 目 己 原创 的 作品 。 如 果 你 真 的 想到 了 这 些 ， 那 就 
不 要 有 什么 顾虑 ， 放 心 大 胆 地 去 尝试 吧 ! 一 边 思考 着 “这 样 写 ， 会 得 到 
这 样 的 结果 ”， 一边 编写 程序 。 如 果实 际 结果 和 预期 结果 不 一 人 怪 的 话 ， 
就 要 对 其 原因 进行 分 析 ， 并 再 次 进行 挑战 和 答 试 。 在 这 一 过 程 中 ， 你 
会 多 次 遇 到 同样 的 代码 ， 语 法 结构 卓然 也 就 记 下 来 了 。 在 分 析 程序 没 
有 按照 预期 顺利 运行 的 原因 时 ， 大 家 可 以 参考 本 书 中 有 关 CPU 及 内 存 
机 制 的 知识 ， 肯 定 会 大 有 帮助 的 。 


在 不 断 犯错 纠 错 的 过 程 中 ， 慢 慢 地 就 能 得 到 和 预期 一 致 的 运行 结 
末 ， 这 时 你 就 是 一 个 合格 的 程序 员 了 。 所 谓 编程 ， 就 是 把 程序 员 的 思 
考 方式 用 编程 语言 的 语法 结构 表示 出 来 ， 然 后 再 传递 给 计算 机 运行 。 
如 采 能 进行 编程 的 话 ， 就 可 以 让 计算 机 按照 目 己 的 思考 方式 来 运行 。 
这 真 的 是 一 件 让 人 愉悦 的 事情 。 通 过 阅读 本 书 ， 了 解 了 程序 的 运行 机 
制 后 ， 相 信 大 家 更 能 体会 到 编程 的 乐趣 。 
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结语 


记得 有 “自己 吓 距 自己 是 最 可 怕 的 事情 ”这 样 的 说 法 。 如 末 总 是 想 
一 些 令 目 己 担心 恕 惧 的 事情 ， 梧 万 的 花 示 都 能 被 看 成 网 灵 ， 这 人 句 话说 
的 就 是 这 样 的 心理 。 这 种 心理 也 适用 于 编程 ， 在 了 解 程序 的 实质 前 ， 
大 家 也 许 会 觉得 程序 很 难 。 面 对 困难 ， 我 们 会 感到 疏 惧 ， 笔 者 也 不 例 
外 。 还 记得 刚 接触 计算 机 时 ， 笔 者 也 经 常 感到 担 优 。 


不 过 ， 对 已 经 谈 过 本 书 的 各 位 谈 者 来 说 ， 人 
怕 的 事情 了 吧 。 程 序 的 运行 机 制 其 实 很 简单 ， 这 一 点 想必 大 家 也 都 有 
了 切身 体会 。 不 管 今后 的 计算 机 怎么 发 展 ， 站 
大 变化 的 。 因 此 ， 请 大 家 务必 放松 心情 ， 无 所 旦 惧 地 继续 向 新 技术 发 
起 挑战 吧 ! 


感谢 各 位 庶 痢 阅读 本 书 。 也 祝 各 位 的 编程 之 路 一 路 通畅 。 


致谢 


值 此 本 书 发 行 之 际 ， 对 从 策划 阶段 就 对 本 书 给 予 悉心 指导 的 《日 经 
Software 》 的 柳 田 俊 稼 主编 、 早 圾 利之 先生 、 烟 阳 一 即 先生 ， 以 及 出 版 
社 的 高 虽 知 子女 士 等 各 位 同仁 ， 一 并 致 以 次 次 的 谢意 。 此 外 ， 笔 者 在 
《日 经 Software 》 上 连载 “程序 是 怎样 跑 起 来 的 ”一 文 时 ， 热 心 的 读者 朋 
友 们 为 笔者 指出 了 不 足 及 笔 误 ， 并 写 信 豆 励 笔者 ， 信 此 机 会 也 癌 各 位 
致 以 这 次 的 感谢 。 
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翻译 日 文书 或 文章 : @ 图 灵 乐 区 

翻译 韩文 书 ，@ 图 灵 陈 曦 

电子 书 合作 : @hi_jeanne 

图 灵 访 谈 /《 码 农 》 杂 志 : @ 李 盼 ituring 

加 入 我 们 ， @ 王 子 是 好 人 
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@ 如 何 向 小 学 生 讲 解 CPU 和 二 进 制 ? 
@ 如 何 向 中 学 生 讲 解 内 存 和 磁盘 ? p 
@ 如 何 向 女 高 中 生 讲解 操作 系统 的 原理 ? wl 


太 以 图 配 文 ， 深 入 讲解 编程 基础 知识 
太 语言 通俗 ， 即 使 是 文科 生 也 能 看 得 懂 
太 特 设 “如 果 是 你 ， 你 会 怎么 做 ? ”专栏 ， 生 动 有 趣 
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一 
看 元 了 
如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com ， 会 有 编辑 或 作 译 者 协助 
答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 
如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : ebook@turingbook.com。 
在 这 里 可 以 找到 我 们 : 


微 博 @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 

微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 

微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 

微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精 彩 人 生 
微 信 图 灵 教 育 :turingbooks 
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